Перевод содержимого из HTML страницы в текстовый документ
Категория: Delphi/Pascal
2011-09-09 18:34:30
Программа перевода содержимого из HTML страницы в текстовый документ. Нужно чтобы все данные: текст, таблицы и т.д переносились в текстовый файл.
code: #delphi
uses Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms, Dialogs, ActiveX, OleCtrls, SHDocVw, StdCtrls; type TForm1 = class(TForm) WebBrowser1: TWebBrowser; Button1: TButton; SaveDialog1: TSaveDialog; procedure Button1Click(Sender: TObject); procedure FormCreate(Sender: TObject); private { Private declarations } public { Public declarations } procedure SaveHTMLSourceToFile(const FileName: string; WB: TWebBrowser); end; var Form1: TForm1; implementation {$R *.dfm} procedure TForm1.SaveHTMLSourceToFile(const FileName: string; WB: TWebBrowser); var PersistStream: IPersistStreamInit; FileStream: TFileStream; Stream: IStream; SaveResult: HRESULT; begin PersistStream := WB.Document as IPersistStreamInit; FileStream := TFileStream.Create(FileName, fmCreate); try Stream := TStreamAdapter.Create(FileStream, soReference) as IStream; SaveResult := PersistStream.Save(Stream, True); if FAILED(SaveResult) then MessageBox(Handle, 'Fail to save HTML source', 'Error', 0); finally FileStream.Free; end; end; procedure TForm1.Button1Click(Sender: TObject); begin if SaveDialog1.Execute then SaveHTMLSourceToFile(SaveDialog1.FileName+'.txt', WebBrowser1); end; procedure TForm1.FormCreate(Sender: TObject); begin WebBrowser1.Navigate('http://programmersforum.ru'); end; end.
Поделиться: