В моем наборе данных у меня есть поле, в котором хранится текст, помеченный HTML. Общий формат выглядит следующим образом:
<html><head></head><body><p>My text.</p></body></html>
Я мог бы попытаться решить проблему, выполнив следующие действия:
REPLACE(REPLACE(Table.HtmlData, '<html><head></head><body><p>', ''), '</p></body></html>')
Однако это не строгое правило, так как некоторые из записей нарушают стандарты W3C и не включают теги <head>
, например. Хуже того, могут отсутствовать закрывающие теги. Поэтому мне нужно включить функцию REPLACE
для каждого открытого и закрывающего тега, который может существовать.
REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(
Table.HtmlData,
'<html>', ''),
'</html>', ''),
'<head>', ''),
'</head>', ''),
'<body>', ''),
'</body>', ''),
'<p>', ''),
'</p>', '')
Мне было интересно, есть ли лучший способ сделать это, чем использовать несколько вложенных функций REPLACE
. К сожалению, единственными языками, которые я имею в этой среде, являются SQL и Visual Basic (а не .NET).