Russian Qt Forum

Qt => Вопросы новичков => Тема начата: GamBitiK от Апрель 20, 2014, 16:49



Название: Чистка от html тегов
Отправлено: GamBitiK от Апрель 20, 2014, 16:49
Есть ли в Qt функции для чистки текста от html тегов? или что то в этом роде?
от

<strong>«[[CDMA!


Название: Re: Чистка от html тегов
Отправлено: gil9red от Апрель 20, 2014, 17:24
Точно можно вручную, используя QString::replace() :)


Название: Re: Чистка от html тегов
Отправлено: GamBitiK от Апрель 20, 2014, 17:47
Точно можно вручную, используя QString::replace() :)
поясни пожалуйста


Название: Re: Чистка от html тегов
Отправлено: gil9red от Апрель 20, 2014, 18:14
Точно можно вручную, используя QString::replace() :)
поясни пожалуйста

Например:
Код:
    QString text = "&Hello laquo;World!";
    qDebug() << text;
    text = text.replace( QRegExp( "&amp;|laquo;" ), "" );
    qDebug() << text;

Вывод в консоль:

"&amp;Hello laquo;World!"
"Hello World!"


Название: Re: Чистка от html тегов
Отправлено: OKTA от Апрель 21, 2014, 09:12
Но простым replace очень многое пропустишь)
Можно использовать метод QTextEdit toPlainText ()! работает на ура.


Название: Re: Чистка от html тегов
Отправлено: panAlexey от Апрель 21, 2014, 20:48
Есть ли в Qt функции для чистки текста от html тегов? или что то в этом роде?
от

&lt;strong&gt;&amp;laquo;[[CDMA!

[[CDMA! - XML ?
Может лучше парсером пройтись и попросить у узла текст?
QTextEdit  с XML справится?

У меня была подобная задачка, когда я нарыл кучу fb2 а мне были нужны тексты для читалки.
Штуки 4-ре я очистил врукопашную с помощью регекспов в нотепаде++ и какой-то матери.
А потом нарыл читалку которая экспортит в txt.