Перевод содержимого из HTML страницы в текстовый документ

Программа перевода содержимого из HTML страницы в текстовый документ. Нужно чтобы все данные: текст, таблицы и т.д переносились в текстовый файл.

code: #delphi
uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs, ActiveX, OleCtrls, SHDocVw, StdCtrls;
type
  TForm1 = class(TForm)
    WebBrowser1: TWebBrowser;
    Button1: TButton;
    SaveDialog1: TSaveDialog;
    procedure Button1Click(Sender: TObject);
    procedure FormCreate(Sender: TObject);
  private
    { Private declarations }
  public
    { Public declarations }
    procedure SaveHTMLSourceToFile(const FileName: string;
  WB: TWebBrowser);
  end;
var
  Form1: TForm1;
implementation
{$R *.dfm}
procedure TForm1.SaveHTMLSourceToFile(const FileName: string;
  WB: TWebBrowser);
var
  PersistStream: IPersistStreamInit;  
  FileStream: TFileStream;  
  Stream: IStream;  
  SaveResult: HRESULT;  
begin  
  PersistStream := WB.Document as IPersistStreamInit;  
  FileStream := TFileStream.Create(FileName, fmCreate);  
  try
    Stream := TStreamAdapter.Create(FileStream, soReference) as IStream;  
    SaveResult := PersistStream.Save(Stream, True);  
    if FAILED(SaveResult) then  
      MessageBox(Handle, 'Fail to save HTML source', 'Error', 0);  
  finally
    FileStream.Free;  
  end;
end;  
 
procedure TForm1.Button1Click(Sender: TObject);
begin
if SaveDialog1.Execute then
    SaveHTMLSourceToFile(SaveDialog1.FileName+'.txt', WebBrowser1);
end;
procedure TForm1.FormCreate(Sender: TObject);
begin
WebBrowser1.Navigate('http://programmersforum.ru');
end;
end.
Поделиться:

Похожие статьи: