Office: (Office 2000) Aus HTML Datei lesen und Datensätze erstellen

Helfe beim Thema Aus HTML Datei lesen und Datensätze erstellen in Microsoft Access Hilfe um das Problem gemeinsam zu lösen; so, hier mal was ich mir so zusammengebastelt habe. bekomme genau das was ich auch brauche. nun muss ich mir nur noch eine logische Datenbankstruktur... Dieses Thema im Forum "Microsoft Access Hilfe" wurde erstellt von agmesia, 15. März 2008.

  1. Aus HTML Datei lesen und Datensätze erstellen


    so, hier mal was ich mir so zusammengebastelt habe. bekomme genau das was ich auch brauche.

    nun muss ich mir nur noch eine logische Datenbankstruktur überlegen worin ich die werte hinterlasse.

    Denn:
    -Jedes Einzelteil sollte nur einmal in der DB sein
    -Wenn jedoch eine änderung eines Teils vorkommt, z.B. ändert sich die Laserzeit, da wir neine bessere Maschine bekommen haben. Soll gefragt werden ob man das alte Teil überschreiben will, was aber schlecht ist wenn man frühere Programme prüfen möchte, oder ob eine Veite version dieses Teil angelegt werden soll.


    Ich denke mal ich mache es (fuer den anfang) mit tbl_Programm und tbl_Einzelteil.
    dann kann ich mir immer mit dlookup die ID des Teils suchen, welches ich gerade "analysiert" habe, und diese zuteilen.

    Ma schaun ob das was wird.
     
    agmesia, 18. März 2008
    #16
  2. Hallo zusammen,

    Bei so umfangreichen und komplexen HTML-Seiten ist es, glaube ich, einfacher, das DOM-Objektmodell zu verwenden, anstatt den HTML-Text mit Stringoperationen zu zerlegen.
    Das Objektmodell kommt aus der Verweisdatei "Microsoft HTML Library", die auf jedem Rechner drauf ist.
    In der Demo im Anhang wird ein Webbrowser-Steuerlelement verwendet, um die Seite erstmal zu laden - ich hoffe, das läuft bei euch (IE7 verwendet). An sich bräuchte man das gar nicht, weil man die HTML-Seite auch direkt - etwa über HTTPXML - in eine Document-Objektvariable laden könnte. Hier hat man aber so mehr Kontrolle über das Resultat.

    Das HTML-Dokument wird dann auf Tabellen analysiert und Zellen ausgelesen und deren Inhalte in die Tabelle tblEinzelteilinfos gespeichert.
    Wie man sehen kann, geht das also mit dem DOM-Modell mit sehr viel weniger Codezeilen und vor allen Dingen auch wesentlich schneller. *wink.gif*

    Ich hab mal nur die Tabelle mit den Einzelteilinformationen genommen. Mit den anderen Tabellen kann man analog verfahren.

    Ciao, Sascha
     
    Sascha Trowitzsch, 19. März 2008
    #17
  3. Vom Meister lernen heisst Siegen lernen.

    Wenn man das richtige Handwerkszeug hat und dann noch damit umgehen kann, sieht es dann richtig einfach aus. Feine Arbeit.
     
  4. Aus HTML Datei lesen und Datensätze erstellen

    Danke, Eberhard.
    Warum ich mir die Mühe gemacht habe, die Demo zu programmieren:
    Die Frage nach Auslesen von HTML-Seiten kommt immer wieder. Ist ja auch plausibel und ich selbst stand ab und an auch vor der Aufgabe, Tabellen aus dem Web auslesen zu müssen.
    Hier im Forum findet man aber bislang immer nur die String-Varianten als Lösung. Deshalb wollte ich hier mal grundlegend zeigen, wie flexibel das mit MSHTML geht. Das Beispiel lässt sich ja gut auf andere Fälle übertragen.

    Gruß, Sascha
     
    Sascha Trowitzsch, 19. März 2008
    #19
  5. wahh *biggrin.gif*
    das ist wirklich wenig Code und ne super geschwindigkeit.

    Doof ist nur, ich habe es nun geschaft den Stringcode so anzupassen das ich genau das bekomme wie ich es haben möchte.

    wie kann ich mein code in deiner wundervollen schnellen Variable umsetzen?#

    ich habe dort ein Filesearch mit eingebaut auf ordner "G:/TB Aufträge"

    also müsst ihr das eben ändern, falls ihr es antestet.

    wäre echt schick wenn ihr mir das ma erklären würdet wie ich die Objekt Varriante so umsetze, Nichts gegen die Version von Eberhard, aber das geht wirklich schneller und ist schick anzusehen.

    Und eine frage wäre da noch, es wird ja im formular die HTML datei dargestellt, wenn ich aber nun mehrere habe, wie es bei mir öfter vorkommt, kann man die dort untereinander anzeigen? sonst hätt ich am ende ja nur die letzte denke ich mal.

    anbei mal meine DB, ein par zusammengehörende HTML dateien, und ein Screen von den Pfadverzeichnis, in welchen sich unsere Dateien befinden. Damit kann man das vieleicht besser nachvollziehen was ich gebastelt habe.

    MfG: Marco mit 1000 Dank
     
    agmesia, 19. März 2008
    #20
  6. \@Sascha:
    Ich denke, wenn Deine Demo ins Code-Archiv verschoben wird, kann man sie (später) leichter wiederfinden. Noch mancher wird sich in der Nachfolge über einen solchen Fund freuen.
    Vielleicht dazu eine leichte Korrektur: Es gibt im Dokument zwei Tabellen, die den Begriff "EINZELTEILINFORMATION" enthalten. Das kann irritieren. Bezugnehmend zum aktuellen Thema wertest Du dann gerade die Tabelle aus, woraus agmesia keine Informationen will, die aber zur Veranschaulichung sehr geeignet ist.

    @agmesia:
    Das bleibt Dir ja. Irgendwann gibt es auch mal reine Texte auszuwerten, wo man nicht zeilenweise arbeiten kann ...

    Das Beispiel schaue ich mir noch einmal an - schon aus Eigeninteresse.

    Bei vielen auszuwertenden Dateien wird man wohl die Auswertung und die Anzeige voneinander trennen.
     
  7. Guten morgen Eberhard,

    nett das du dir das nochmal anschaust, ich hab nur nie mit Objekten gearbeitet und bin mir da nicht ganz schlüssig ob ich das auslesen vom Objekt genauso kürzen und bearbeiten kann, wie ich das mit dem String getan habe.

    Ich steige zwar einigermaßen durch die Schleifen durch, und begreife auch das er nach den "table-tags" schaut und dann ließt, aber wie ich genau die Info herausziehen soll,welche ich nun so mit der String-fummelei bekommen habe, weis ich nicht genau.

    das Ihr mir hier nichts fertig programmiert ist 1. nicht verkehrt, und 2. auch kein problem fuer mich.

    Was ich z.B. meine ist, dass wir festgestellt haben das manche HTML Dateien "Falsch" sind.

    z.B. Findet man in der Pfadangabe der .geo Datei mal "/" und mal "\" als Ordnertrennzeichen.
    Oder die Namensgabe eines Teils ist Falsch obwohl es das gleiche teil ist.
    SD00013592-2MM
    SD00013592-2MM1

    Wir wissen selber nicht warum er die "1" dahinterschreibt, daher habe ich nun angefangen aus dem .geo Pfad auszulesen.

    ebenso gibt es:
    G:\ZEICHNUNGEN GEO UND MTL\X\XH\XH300407-28-10MM-GETAG-25623.GEO
    und der Name lauftet aber:XH300407-28-10MM-GE1
     
    agmesia, 19. März 2008
    #22
  8. Aus HTML Datei lesen und Datensätze erstellen

    Eben weil die Zeichenfolgen manchmal differieren (das könnt Ihr dem Softwareentwicklern unter die Nase reiben verbunden mit einigen unauffälligen Wünschen) und damit das Finden der richtigen Positionen erschwert wird, wird das Auslesen der Tabellenzellen (nach Abzählen?) weniger fehleranfällig sein.

    Das kann ich gar nicht glauben. Ist Dir das Recordset-Objekt unbekannt?

    Nebenbei: Warum läuft das Thema als abgeschlossen?
     
  9. hmm
    sobald ich meine Variable:
    Dim flagfound2 As Boolean

    erstelle, sagt er mir: "Funktionsmerkmal oder Objektbibliothek nicht unterstüzt" und springt in zeile:

    Set objDoc = objWeb.Document

    Ich wollte die Variable benutzen um noch eine Tabelle weiter zu springen, aber naja. soweit kommts erst garnet

    Wenn ich das dann neu entpacke, geht das wieder, sobal ich die Variable deklarier, wieder der fehler. ich versteh es net.

    Code:
     
    agmesia, 20. März 2008
    #24
  10. Hast Du den Verweis gesetzt?
     
  11. ja klar, ist ja sofort gesetzt wenn ich mir die datei sauge, sie ist auch weiterhin gesetzt wenn der fehler auftritt, ich versteht das net.

    ich ändere nichts an der version außer das ich meine variable einfüge und dann mal kompilieren lasse, dann kommt sofort der fehler

    edit:

    hatte wohl ein threat überlesen oder ein teil daraus.
    doch das recordset objekt ist mir bekannt, aber so intensiv ,außer das ich es mal in einem kombifeld bei not in list benutzt habe ,auch nun wieder nicht.

    Habe das Thema wieder auf unerledigt geklickt, hatte ich auch ein einem threat geschrieben, da ich dachte den rest selber schaffen zu können, was ich ja auch relativ geschafft habe, aber nun die neue möglichkeit mit dem html-objekt da ist.
     
    agmesia, 20. März 2008
    #26
  12. Lies noch mal, was in #17 steht zum Webbrowser-Steuerelement.
    Die Variable objWeb bezieht daraus ihren Inhalt
     
  13. Aus HTML Datei lesen und Datensätze erstellen

    hmm,
    aber ich hab das gefühl das mir das bei dem fehler nicht weiterhilft.
    ich mache ja nix außer eine Variable Definieren.

    Vorgang:
    -HTML_analysieren.zip aus Post 17 Saugen
    -entpacken
    -öffnen
    -Test, Funktioniert einwandfrei
    -alt+F11, in die Funktion "Private Sub AnalyzeHTML()" gehen
    - "Dim flagfound2 As Boolean" eintragen
    -Menu/Debugen/Kompilieren von HTML_analysieren.mdb wählen
    -Zack fehler kommt.

    Mehr, und nichts anderes habe ich gemacht, nichts umgeschrieben, verweise geändert oder ähnliches. Ich kann es mir beim besten willen nicht erklären was ich falsch mache, oder warum mein acces rumspinnt, hab schon /recompile versucht, aber bringt auch nichts, hab ich auch nicht erwartet
     
    agmesia, 20. März 2008
    #28
  14. Das scheint für eine Massenverarbeitung von Dateien der bessere Weg zu sein. Hat jemand dazu einen ausführlicheren Hinweis oder ein Beispiel?
     
  15. naja, ich hab n bischen was geschaft, soweit ich mich dadurchfressen konnte.

    ist fuer mich ein guter anfang, und es kommt schon wieder in "Linien" im Direktfenster, also schon auslesbar fuer mich.

    nur ein Prob:

    Code:
     
    agmesia, 20. März 2008
    #30
Thema:

Aus HTML Datei lesen und Datensätze erstellen

Die Seite wird geladen...
  1. Aus HTML Datei lesen und Datensätze erstellen - Similar Threads - HTML Datei Datensätze

  2. HTML Datei einbinden klappt nicht wie ich möchte

    in Microsoft PowerPoint Hilfe
    HTML Datei einbinden klappt nicht wie ich möchte: Hallo Zusammen, ich habe eine HTML Datei (test.html) und einen entsprechenden Ordner mit den in der HTML Datei enthaltenen Bildern (test_images) in einem gemeinsamen Ordner gespeichert. Im selben...
  3. Inhalt aus HTML Dateien automatisch einlesen

    in Microsoft Excel Hilfe
    Inhalt aus HTML Dateien automatisch einlesen: Hallo zusammen, ich möchte eine Verarbeitung von Daten, die aus dem SAP System kommen, automatisieren. Der Ablauf ist bisher wie folgt: Ich bekomme täglich an ein E-Mail Postfach Mails geschickt...
  4. Html Dateien in Access Memofeld importieren

    in Microsoft Access Hilfe
    Html Dateien in Access Memofeld importieren: Hallo Ich habe ca 20000 Html Dateien die ich in ein Access Memofeld einlesen will. Für jede Datei ein Datensatz. Den Pfad und den Namen der Datei habe ich in der Tabelle (mit dem sinnigen name...
  5. Outlook 2016 // Datei einfügen // Als Text einfügen wird nicht als Option angezeigt

    in Microsoft Outlook Hilfe
    Outlook 2016 // Datei einfügen // Als Text einfügen wird nicht als Option angezeigt: [ATTACH]Hallo zusammen, ich habe folgendes Problem: ich würde gerne in Outlook 2016 eine HTML Datei einfügen. Dazu gehe ich auf "Einfügen , Datei einfügen, und wenn ich dann eine Datei...
  6. HTML-Dateien als Nur-Text öfnnen

    in Microsoft Word Hilfe
    HTML-Dateien als Nur-Text öfnnen: Hallo, bisher habe ich meine HTML-Dateien immer in WORD (2000) bearbeitet und dazu im TXT-Modus geöffnet. In WORD 2010 aber kommt die Abfrage vor dem Öffnen, in welchem Modus die Datei geöffnet...
  7. Datenimport HTML-Datei fehlerhaft (führende Null + Exponent)

    in Microsoft Excel Hilfe
    Datenimport HTML-Datei fehlerhaft (führende Null + Exponent): Hallo, ich habe das Problem, eine HTML-Datei in Excel 2003 importieren zu müssen. Der Import der Artikelnummern läuft fehlerhaft. Führende Nullen werden nicht übernommen; Artikelnummern mit...
  8. ActiveX in WORD (bzw. PDF- und HTML-Dateien)

    in Microsoft Word Hilfe
    ActiveX in WORD (bzw. PDF- und HTML-Dateien): OS: Windows XP Office: 2022 Ich habe Word-Dateien via Adobe Acrobat in PDF transformiert. Die Dateien bestehen aus Text und simplen Grafiken. Ich habe einen Index erstellt - ebenfalls als DOC...
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Auf dieser Website werden Cookies für die Zugriffsanalyse und Anzeigenmessung verwendet.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden