in
La comunità italiana dedicata a Sviluppatori e Architetti IT delle piattaforme Windows

parse html

Ultimo messaggio ricevuto il 18-07-2005 10.07 da torquemada. 5 risposta(e).
Pagina 1 di 1 (6 elemento/i)
Ordina messaggi: Precedente Successivo
  • 18-07-2005 10.07

    parse html

    Ciao a tutti, ho un problema che non so come risolvere. Sto cercando di fare il parse html di alcune pagine web da vb.net. Usando i webcontrol uniti alla libreria mshtml funziona tutto a meraviglia. Il problema è che le pagine su cui devo fare il parse contengono delle immagini ed io non ho tempo di aspettare il document_complete del webcontrol. Così sto cercando di non utilizzarlo e l'unico modo che sembra funzionare è quello di recuperare l'html in questo modo:

    Dim objWC As New System.Net.WebClient
    Return New System.Text.UTF8Encoding().GetString(objWC.DownloadData(URL))

    Il problema è che la stringa che ottengo non riesco ad inserirla in un mshtmlDocument e così non posso farne il parse. Qualcuno ha qualche idea di come posso fare? grazie

    • No log
  • 18-07-2005 17.14 In risposta a

    Re: parse html

    Esattamente che errore ottieni cercando di inserire la stringa in un mshtmlDocument?
    • No log
  • 18-07-2005 19.11 In risposta a

    Re: parse html

    In pratica non so come fare ad inserirla. Se cerco di convertire con DirectCast mi dice che la conversione non può essere fatta. Il vero problema comunque è che non trovo nessuna documentazione sulla libreria mshtml. E' un problema che ho da giorni ormai.. Se sai aiutarmi ad ottenere un doc html in altro modo te ne sarei grato.
    grazie
    • No log
  • 19-07-2005 10.42 In risposta a

    Re: parse html

    Se il documento HTML è ben formato, puoi leggerlo con XmlDocument (namespace System.Xml, mi pare) che ti offre tutta una serie di funzioni molto comode per navigare gerarchicamente tra i nodi del documento.
    • No log
  • 19-07-2005 10.58 In risposta a

    Re: parse html

    Il documento non è ben formattato... Infatti usando le lib xml riesco a fare il load di pagine xml ma non della pagina che mi serve...esisteranno altri modi?
    • No log
  • 19-07-2005 11.56 In risposta a

    Re: parse html

    Beh, le classi di System.XML sarebbero state l'ideale... Posso solo suggerirti di approfondire le motodologie alternative curiosando nei vari esempi pubblicati su Internet, cercando di trovare qualche spunto utile:

    Visual Basic.NET

    HOW TO: Gestire eventi di documento in un'applicazione Visual Basic .NET

    Visual C++ 6.0

    Using MSHTML Editing in VC6 Doc/View Applications

    C#.NET (?)

    Using MSHTML Advanced Hosting Interfaces

    How to load HTML into mshtml.HTMLDocumentClass with UCOMIPersistFile and my ignorance

    Magari, facci sapere quando trovi la soluzione adatta. Wink [;)] Buon lavoro!

    • No log
Pagina 1 di 1 (6 elemento/i)
Prelevato da http://www.devspy.com/forums/p/3756/3761.aspx
DevSpy.com 6.0 © 2001-2008 - Alcuni Diritti Riservati
Salvo diversa indicazione, tutti i contenuti sono pubblicati sotto licenza "Creative Commons Attribution-Share Alike 3.0"