msgbartop
Блог Oracle разработчика
msgbarbottom
foxbase

30.05.2010 Как на Delphi из HTML получить текст?

При программировании на Delphi иногда возникает задача перевести текст, содержащий в себе HTML символы в обычный нормальный текст. Например, интерфейс Twitter выдает текст сообщений в HTML формате, который содержит такие спецсимволы как &quot& и им подобные. 
Перекодировать такой текст средствами Delphi можно при помощи интерфейсов MSHTML. Вот простая функция, которая позволяет это сделать:

uses MSHTML, ComObj, ActiveX;
function HTMLToText(HTML: string): string;
  Var Doc: IHTMLDocument2;
      vArr: Variant;
begin
  Doc:=CreateComObject(Class_HTMLDOcument) as IHTMLDocument2;
  vArr:=VarArrayCreate([0, 0], VarVariant);
  vArr[0]:=HTML;
  Doc.Write(PSafeArray(System.TVarData(vArr).VArray));
  Result:=Doc.body.innerText;
end;


Оставьте свой комментарий

Вы должны быть авторизированны, чтобы оставить комментарий.