The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"Регулярные выражения, как вырезать теги"
Вариант для распечатки  
Пред. тема | След. тема 
Форумы Программирование под UNIX (Public)
Изначальное сообщение [ Отслеживать ]

"Регулярные выражения, как вырезать теги"  
Сообщение от Кузя on 07-Авг-08, 14:19 
для вырезания тега < > можно использовать <[^>]*> а как вырезать тег (( )) ?
Высказать мнение | Ответить | Правка | Cообщить модератору

 Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "Регулярные выражения, как вырезать теги"  
Сообщение от Аноним (??) on 08-Авг-08, 08:25 
>для вырезания тега < > можно использовать <[^>]*> а как вырезать тег (( )) ?

могу предложить \(\(.*?\)\)

но это лишь чуть лучше вашего решения.
протестируйте ваш регексп на конструкциях:
"<a>слово</a>" и
"<img src="img.png" alt=">">"
я бы сказал, что он никуда не годится (как и мой :-))

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

2. "Регулярные выражения, как вырезать теги"  
Сообщение от anonymous (??) on 10-Авг-08, 20:24 
Никогда не юзайте регекспы для парсинга HTML-я (удаление тегов это частный вид парсинга).  Регекспы просто не могут охватить грамматику HTML, они из разных классов, и всё тут.  Любое решение этого вопроса только-на-регекспах уже содержит ошибку, видите ли вы её или нет.  Правильное решение требует написания полноценного парсера (в котором можно юзать регекспы, но они будут играть не ключевую роль).  А лучше всего юзать готовые библиотеки для разбора HTML или XML.
Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

3. "Регулярные выражения, как вырезать теги"  
Сообщение от angra (ok) on 12-Авг-08, 04:35 
Уважаемый, вы тут полную чушь сморозили. Если лично вы не умеете пользоваться регексами, то не надо других от этого отговаривать. Зачем нужен полноценный парсер(кстати что это такое в _вашем_ понимании, то есть что является результатом его работы?), если задача решается парой регексов?
Ну а про "не могут охватить грамматику HTML" так ведь даже браузеры в этом не едины, а вы хотите каким то конкретным парсером обойтись.
Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

4. "Регулярные выражения, как вырезать теги"  
Сообщение от BigHo on 21-Авг-08, 20:37 
Вообще-то человек дело говорит. Регекс хоть и мощная штука, но разбирать им html, это как откручивать отверткой гвозди: инструмент не по задаче, и сколько бы опыту не приобрел в этом трудном деле - все равно будет неудобно.
Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

5. "Регулярные выражения, как вырезать теги"  
Сообщение от angra (ok) on 22-Авг-08, 14:55 
Что в вашем понимании "разбирать им html"? Что является результатом "разбирания"? Приведите практический пример где это вам было необходимо.
Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

6. "Регулярные выражения, как вырезать теги"  
Сообщение от BigHo on 22-Авг-08, 17:04 
>Что в вашем понимании "разбирать им html"? Что является результатом "разбирания"? Приведите
>практический пример где это вам было необходимо.

особо не надо было, а где надо - справлялся SAX парсером - никак уж не regex-ом (бррр-р-р-р-р). Могу сказать, что есть такие задачи, когда будет неудобно пользоваться даже SAX-ом. Конкретизировать не буду - ибо лень. В качестве ссылок могу предложить поискать по ключевым словам XSLT, Tidy - это то, будет интересно человеку, уставшему от регекса.

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Оцените тред (1=ужас, 5=супер)? [ 1 | 2 | 3 | 4 | 5 ] [Рекомендовать для помещения в FAQ]




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру