was ist neu ¦  programmier tips ¦  indy artikel ¦  intraweb artikel ¦  informationen ¦  links ¦  interviews
 sonstiges ¦  tutorials ¦  Add&Win Gewinnspiel

Tips (1541)

Dateien (137)
Datenbanken (90)
Drucken (35)
Grafik (114)
IDE (21)
Indy (5)
Internet / LAN (130)
IntraWeb (0)
Mathematik (76)
Multimedia (45)
Oberfläche (107)
Objekte/
ActiveX (51)

OpenTools API (3)
Sonstiges (126)
Strings (83)
System (266)
VCL (242)

Tips sortiert nach
Komponente


Tip suchen

Tip hinzufügen

Add&Win Gewinnspiel

Werbung

39 Visitors Online


 
...den Text einer HTML Datei extrahieren?
Autor: EddieShipman
[ Tip ausdrucken ]  

Tip Bewertung (68):  
     


// Very easy way to parse text from HTML using IHTMLDocument2.

uses
  
mshtml, ActiveX, ComObj;

procedure TForm1.Button1Click(Sender: TObject);
var
  
IDoc: IHTMLDocument2;
  Strl: TStringList;
  sHTMLFile: string;
  v: Variant;
  Links: IHTMLElementCollection;
  i: Integer;
  Link: IHTMLAnchorElement;
begin
  if 
OpenDialog1.Execute then
  begin
    
sHTMLFile := OpenDialog1.FileName;
    Strl := TStringList.Create;
    try
      
Strl.LoadFromFile(sHTMLFile);
      Idoc := CreateComObject(Class_HTMLDOcument) as IHTMLDocument2;
      try
        
IDoc.designMode := 'on';
        while IDoc.readyState <> 'complete' do
          
Application.ProcessMessages;
        v := VarArrayCreate([0, 0], VarVariant);
        v[0] := Strl.Text;
        IDoc.Write(PSafeArray(System.TVarData(v).VArray));
        IDoc.designMode := 'off';
        while IDoc.readyState <> 'complete' do
          
Application.ProcessMessages;
        Memo1.Lines.Text := IDoc.body.innerText;
      finally
        
IDoc := nil;
      end;
    finally
      
Strl.Free;
    end;
  end;
end;


 

Bewerten Sie diesen Tipp:

dürftig
ausgezeichnet


Copyright © by SwissDelphiCenter.ch
All trademarks are the sole property of their respective owners