При программировании на Delphi иногда возникает задача перевести текст, содержащий в себе HTML символы в обычный нормальный текст. Например, интерфейс Twitter выдает текст сообщений в HTML формате, который содержит такие спецсимволы как " & и им подобные.
Перекодировать такой текст средствами Delphi можно при помощи интерфейсов MSHTML. Вот простая функция, которая позволяет это сделать:
uses MSHTML, ComObj, ActiveX;
…
function HTMLToText(HTML: string): string;
Var Doc: IHTMLDocument2;
vArr: Variant;
begin
Doc:=CreateComObject(Class_HTMLDOcument) as IHTMLDocument2;
vArr:=VarArrayCreate([0, 0], VarVariant);
vArr[0]:=HTML;
Doc.Write(PSafeArray(System.TVarData(vArr).VArray));
Result:=Doc.body.innerText;
end;
Оставьте свой комментарий
Вы должны быть авторизированны, чтобы оставить комментарий.