Office: (Office 2000) Aus HTML Datei lesen und Datensätze erstellen

Helfe beim Thema Aus HTML Datei lesen und Datensätze erstellen in Microsoft Access Hilfe um das Problem gemeinsam zu lösen; Moin Leutz, ich habe gerade mal ein wenig gesucht, vieleicht hab ich auch dran vorbeigeschaut falls es schon ein ähnliches Thema gibt. Zum Thema: Wir... Dieses Thema im Forum "Microsoft Access Hilfe" wurde erstellt von agmesia, 15. März 2008.

  1. Aus HTML Datei lesen und Datensätze erstellen


    Moin Leutz,

    ich habe gerade mal ein wenig gesucht, vieleicht hab ich auch dran vorbeigeschaut falls es schon ein ähnliches Thema gibt.

    Zum Thema:
    Wir haben in unserer Firma ein Programm, welches uns .html Dateien erstellt.(Siehe Anhang)

    Aus dieser Datei würden wir gerne einige Dinge auslesen um daraus Lieferscheine zu machen.

    Das was ich dann auslese sollte dann natürlich auch in der datenbank gespeichert werden. Da erst später die lieferscheine gemacht werden, und die Nummer zu dem Lieferschein per hand eingetragen werden muss, aber da würd ich selber vieleicht noch was zu finden.

    Mein Problem an sich ist:
    Wie lese ich die html datei aus, welche sich auch ändert, da mal mehr, und mal weniger Teile auf einem Blech gelasert werden.

    Alternativ hätte ich auch eine .EIN datei, welche aber ganz normalen Text enthelt wie eine .txt datei, wo mir aber 2 Informationen Fehlen, welche in dem HTM Document vorhanden sind.

    :)
     
    agmesia, 15. März 2008
    #1
  2. HTML ist nichts anderes als Text. Wenn Du die Regeln kennst, wie das Dokument aufgebaut ist, kannst Du es zielgerichtet auslesen.

    Vielleicht prüfst Du auch, ob dieses Programm neben der Ausgabe des HTML-Dokumentes auch z.B. eine TXT-Datei mit den benötigten Daten erzeugen kann, sprich versuche die daten an der Quelle direkt abzugreifen.
     
  3. Hallo,

    es werden mehrere Dateien erstellt, unter anderem auch txt, doc, eng, ein, erg, usw. Manche enthalten ebenso Teile der Informationen die ich gerne auslesen möchte, sie wären warscheinlich sogar leichter auszulesen, aber ich weis nicht wie sinnvoll es ist mehrere verschiede Datein zu durchblättern und auszulesen, wenn alles in der html datei vorhanden ist.

    noch eine Frage,

    wenn ich nun die HTML datei auslese, würde ich dann den Programmiercode auslesen, oder das was die HTMl wiedergeben würde? warscheinlich den Pragrammiercode oder? Nach eigener einschätzung, ist es umständlich etwas zum auslesen zu schreiben, da dort ja auch viele HTML-Tags zu finden sind.
     
    agmesia, 17. März 2008
    #3
  4. Aus HTML Datei lesen und Datensätze erstellen

    Zum 1. Absatz: Ich weiß es auch nicht. Sinnvoll wäre ein (einfach zu handhabendes) Dokument, in dem alle benötigten Informationen sind. Das kann vielleicht auch separat erzeugt werden. Bei der Vielzahl der Ausgaben sollte es doch Flexibilität des Programms bzw. des Programmierers geben.

    Zum 2. Absatz: Genau. Deswegen obiger Hinweis .
     
  5. ja, das problem ist aber das es uns nicht möglich ist die ausgaben des Programms zu ändern. wäre warscheinlich wieder eine Kostensache durch den hersteller, da er uns dann erst den Support vorbeischicken würde um das ändern zu lassen.

    wenn ich wüsste wie, würde ich mir natürlich eine einfache Datei ausgeben.

    Das schlimmste an der sache ist ja, Das programm das mir diese Dateien erstellt arbeitet mit einem SQL server, und wir haben uns den auch angeschaut, und drauf zugreifen kann ich auch mit access, ohne probleme.

    Jedoch sind das so viele Tabelle und Spalten, mit Spaltenbezeichnungen die einem nicht sagen ob das in der spalte gerade der Wert ist den man sucht oder nicht.
    Und auskunft will man uns nicht geben, da es fuer das was ich gerade programmier eine vom hersteller entwickelte version gibt, die aber satte 35.000€ kostet. Und der hersteller verständlicher weise nicht sagt wo was zu finden ist, damit man eben nicht selber in der lage ist etwas zu machen.

    wir haben uns wirklich schon dumm und dämlich gesucht auf dem SQL server *frown.gif*

    Dann mal ne frage nebenbei damit das suchen schneller geht. Da ich noch nie eine Datei so ausgelesen habe, nach welchem Funktionsnamen, oder begriffen sollte ich hier im Forum suchen damit ich mir mal anschaun kann wie ich eine html auslesen kann. wenn ich nach auslesen suche, finde ich einiges, hab mir auch schon welche angeschaut, hat mir aber irgendwie noch nicht weitergeholfen.

    Habe bis jetzt auch nichts programmiert, wollte erstmal drüber nachdenken und mich informieren.

    Ahja, und besten Dank fuer deine Hilfe
     
    agmesia, 17. März 2008
    #5
  6. Naja, Du musst Dir festhalten, wo die benötigten Informationen stehen, z.B.
    - in Tabelle (Name, welche Zeile,Spalte)
    - was steht davor (oder dahinter)

    und sind diese "Regeln" wiederkehrend.

    Suchen im Text mit Instr, Bearbeiten mit Mid, Left, Right, Len u.a. Textfunktionen.

    35.000 €: Da würde ich auch einige Minuten investieren ...
     
  7. joa, ist nicht ganz billig, daher auch das Vorhaben es selber irgendwie zu lösen.

    Najut, ich stempel das hier mal als erledigt ab, denke ich werde schon die befehle zum öffnen/auslesen einer Datei hier im Forum finden und testen wie das so läuft.

    Eine einzige sache brennt mir da noch auf den Lippen.
    Wenn es so sein sollte, das man Zeilenweise Ausließt. Und sagen wir 10 Werte von denen die ich haben möchte sind in einer der HTML-Zeilen. (hab da vorhin ma reingeschaut, kann nämlich gut vorkommen, habs aber noch nicht derart intensiv geprüft) wäre sowas leicht oder eher Kompliziert zu lösen? Da sich die Anzahl ja von Datei zu Datei ändern kann, je nachdem wieviele verschiedene teile gelasert werden sollen.
     
    agmesia, 17. März 2008
    #7
  8. Aus HTML Datei lesen und Datensätze erstellen

    Achtung: In HTML müssen Zeilen in der Darstellung mit Zeilen im Code nicht korrespondieren, da kann es deutliche Unterschiede geben.

    Etwas abweichend: Hier ist ein Thema zum Überarbeiten einer TXT-Datei. Das weicht aber deutlich von Deinem ab.
     
  9. ein meiner probleme wäre dann warscheinlich die Zeilen, wie im Screenshot markiert.

    Da muss ich mir echt was einfallen lassen, denn ich glaube kaum das ich genau bestimmen kann wo was kommt, ich müsste warscheinlich erst auslesen, wieviele Teile es sind, und anhand der zahl dann vieleicht die HTML-Tags an der Stelle zählen, dann einlesen, dann wieder zählen, usw.

    ich werd das mal bei meinen Kolegen ansprechen, ob sich das Aufwand überhaupt lohnt, oder ob wir nicht auf die .EIN Datei zugreifen könne, da dort auch alles drinsteht, in ordendlichem text, fehlen halt nur 2 Werte.

    Verschnitt in % und die Abmessungen des Einzelteils.
     
    agmesia, 17. März 2008
    #9
  10. Hallo Marco,

    ich habe mal ein wenig gesucht und z.B. diesen Beitrag gefunden:
    http://www.ms-office-forum.net/forum....php?t=55120#4
    Wenn Du also die HTML-Datei im Browser öffnest und dann als TXT-Datei speicherst, sieht der Inhalt dort sehr viel übersichtlicher aus.

    Sieh Dir das mal an.
     
  11. hmm, das ist natürlich nicht schlecht, hab mir das gerade mal von hand angeschaut, und bin sehr angesprochen von der idee das so umzusetzen.
    Doch stellt sich nun die Frage, wie automatisier ich das? Denn wir haben da so eine gewisse menge an Dateien... sekunde, ich benutz ma suchen und mach n screenshot.
     
    agmesia, 17. März 2008
    #11
  12. Ich habe festgestellt, dass die Ergebnisse von Firefox und IE sich unterscheiden.

    Nun, wenn es per Hand geht, wird es auch schon fertige Routinen geben, die das automatisiert ablaufen lassen (ich habe da schon eine Spur).

    Kannst Du mal bei der Datei konkret darstellen, welche Werte wohin sollen? Vielleicht als Word-Dokument mit Hervorhebungen und Anmerkungen.

    Dazu ergänzend Extrembeispiele mit wenig und viel Werten (Du sprachst von Unterschieden).
     
  13. Aus HTML Datei lesen und Datensätze erstellen

    So, hab nun eine Doc Datei angehängt , wo ich alles was ich brauche rot und fett markiert habe. Hab nach einem Auftrag mit gaaanz vielen Teilen gesucht, sind um die 30 glaub ich.

    ab dem eintrag:



    den ich gemacht habe, sind es nur noch die Teile, wo ich immer wieder den gleichen wert, des entsprechenden Teiles brauche.

    Die aufträge unterscheiden sich nur ab da. Endweder ein auftrag mit 1 teil oder N Teilen, der obere teil bleibt der gleiche, abgesehen von der Liste direkt über:



    , das ist eine Liste der Einzelteile, die Variiert natürlich auch entsprechend der Anzahl.

    Zum Wohin:

    Kann ich so noch nicht genau sagen, ich habe zwar eine tabellenstruktur von einer anderen DB, welche genau die gleichen werte enthält, das ist aber die DB wo alles per Hand eingepflegt wird, was ich ja nun ausmerzen will/soll.

    Würdest du z.B. hier finden, da geht es noch um die "Handarbeits"-DB
     
    agmesia, 17. März 2008
    #13
  14. Anbei ein Lösungsansatz. Fertig deswegen nicht, weil ich zum einen sinngemäßes Kopieren dem Nutzer überlasse (siehe Kopfdaten) und weil es andererseits Unterschiede zwischen dem ersten (HTML-) Dokument und dem zweiten (Word-) Dokument in den Bezeichnungen zu den Werten gibt (TEILE-ID vs. ZEICHNUNGSNUMMER). Auch das anwendungssicher zu gestalten überlasse ich dem Nutzer.

    Zum Umwandeln des HTML-Textes in Plaintext habe ich HTML2Text verwendet. Achtung: Der resultierende Text ist deutlich umfangreicher als derjenige, der wie oben beschrieben durch Speichern einer HTML-Datei als TXT-Datei im Browser entsteht.

    Der Text wird in einer Textbox angezeigt.

    Die ausgelesenen Werte werden in zwei Arrays abgelegt und können somit einfach in Tabellen gespeichert werden.
     
  15. gute morgen Eberhard

    Das sieht doch schon super aus, hab erst gedacht: "Wasn das fürn KuddelMuddel"*boah aber ist garnicht so wild, auch was bei dir im Debug.Print rauskommt überrascht mich sehr, also positiv versteht sich.*grins

    Ich werde mal schauen wie ich mir was zurechtbiegen kann.*tongue.gif*

    werde sicherlich noch n par fragen haben, aber das ist schon mehr als ein guter ansatz fuer mich, verbindlichsten dank!!!

    MfG: Marco
     
    agmesia, 18. März 2008
    #15
Thema:

Aus HTML Datei lesen und Datensätze erstellen

Die Seite wird geladen...
  1. Aus HTML Datei lesen und Datensätze erstellen - Similar Threads - HTML Datei Datensätze

  2. HTML Datei einbinden klappt nicht wie ich möchte

    in Microsoft PowerPoint Hilfe
    HTML Datei einbinden klappt nicht wie ich möchte: Hallo Zusammen, ich habe eine HTML Datei (test.html) und einen entsprechenden Ordner mit den in der HTML Datei enthaltenen Bildern (test_images) in einem gemeinsamen Ordner gespeichert. Im selben...
  3. Inhalt aus HTML Dateien automatisch einlesen

    in Microsoft Excel Hilfe
    Inhalt aus HTML Dateien automatisch einlesen: Hallo zusammen, ich möchte eine Verarbeitung von Daten, die aus dem SAP System kommen, automatisieren. Der Ablauf ist bisher wie folgt: Ich bekomme täglich an ein E-Mail Postfach Mails geschickt...
  4. Html Dateien in Access Memofeld importieren

    in Microsoft Access Hilfe
    Html Dateien in Access Memofeld importieren: Hallo Ich habe ca 20000 Html Dateien die ich in ein Access Memofeld einlesen will. Für jede Datei ein Datensatz. Den Pfad und den Namen der Datei habe ich in der Tabelle (mit dem sinnigen name...
  5. Outlook 2016 // Datei einfügen // Als Text einfügen wird nicht als Option angezeigt

    in Microsoft Outlook Hilfe
    Outlook 2016 // Datei einfügen // Als Text einfügen wird nicht als Option angezeigt: [ATTACH]Hallo zusammen, ich habe folgendes Problem: ich würde gerne in Outlook 2016 eine HTML Datei einfügen. Dazu gehe ich auf "Einfügen , Datei einfügen, und wenn ich dann eine Datei...
  6. HTML-Dateien als Nur-Text öfnnen

    in Microsoft Word Hilfe
    HTML-Dateien als Nur-Text öfnnen: Hallo, bisher habe ich meine HTML-Dateien immer in WORD (2000) bearbeitet und dazu im TXT-Modus geöffnet. In WORD 2010 aber kommt die Abfrage vor dem Öffnen, in welchem Modus die Datei geöffnet...
  7. Datenimport HTML-Datei fehlerhaft (führende Null + Exponent)

    in Microsoft Excel Hilfe
    Datenimport HTML-Datei fehlerhaft (führende Null + Exponent): Hallo, ich habe das Problem, eine HTML-Datei in Excel 2003 importieren zu müssen. Der Import der Artikelnummern läuft fehlerhaft. Führende Nullen werden nicht übernommen; Artikelnummern mit...
  8. ActiveX in WORD (bzw. PDF- und HTML-Dateien)

    in Microsoft Word Hilfe
    ActiveX in WORD (bzw. PDF- und HTML-Dateien): OS: Windows XP Office: 2022 Ich habe Word-Dateien via Adobe Acrobat in PDF transformiert. Die Dateien bestehen aus Text und simplen Grafiken. Ich habe einen Index erstellt - ebenfalls als DOC...
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Auf dieser Website werden Cookies für die Zugriffsanalyse und Anzeigenmessung verwendet.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden