Как исправить это свойство AttributeError?

Вчера я установил пакет полосок, и теперь мое приложение не работает. Я пытаюсь понять, где проблема. Это связано с PyShell или HTLParser или чем-то еще. Я отправляю с тегом GAE, надеясь, что трассировка из журналов может дать представление о проблеме:

MLStripper instance has no attribute 'rawdata'
Traceback (most recent call last):
  File "/base/python_runtime/python_lib/versions/1/google/appengine/ext/webapp/_webapp25.py", line 703, in __call__
    handler.post(*groups)
  File "/base/data/home/apps/ting-1/1.354723388329082800/ting.py", line 2070, in post
    pitch_no_tags = strip_tags(pitch_original)
  File "/base/data/home/apps/ting-1/1.354723388329082800/ting.py", line 128, in strip_tags
    s.feed(html)
  File "/base/python_runtime/python_dist/lib/python2.5/HTMLParser.py", line 107, in feed
    self.rawdata = self.rawdata + data
AttributeError: MLStripper instance has no attribute 'rawdata'

Это MLStripper:

from HTMLParser import HTMLParser

class MLStripper(HTMLParser):
    def __init__(self):
        set()
        self.fed = []
    def handle_data(self, d):
        self.fed.append(d)
    def get_data(self):
        return ''.join(self.fed)

def strip_tags(html):
    s = MLStripper()
    s.feed(html)
    return s.get_data()

MLStripper работал до вчерашнего дня.

И это мои другие вопросы:

https://stackoverflow.com/info/8152141/how-to-fix-this-attributeerror-with-htmlparser-py

https://stackoverflow.com/info/8153300/how-to-fix-a-corrupted-pyshell-py

Ответ 1

Есть одна или две проблемы с кодом, который вы опубликовали (в основном, для правильной инициализации HTMLParser).

Попробуйте выполнить эту измененную версию вашего script:

from HTMLParser import HTMLParser

class MLStripper(HTMLParser):
    def __init__(self):
        # initialize the base class
        HTMLParser.__init__(self)

    def read(self, data):
        # clear the current output before re-use
        self._lines = []
        # re-set the parser state before re-use
        self.reset()
        self.feed(data)
        return ''.join(self._lines)

    def handle_data(self, d):
        self._lines.append(d)

def strip_tags(html):
    s = MLStripper()
    return s.read(html)

html = """Python <code>easy_install</code>
 makes installing new packages extremely convenient.
 However, as far as I can tell, it doesn't implement
 the other common features of a dependency manager -
 listing and removing installed packages."""

print strip_tags(html)

Ответ 2

Эта ошибка также появляется, если вы переопределите метод reset в классе HTMLParser.

В моем случае я добавил метод с именем reset для некоторых других функций и обнаружил, что, хотя Python не говорит вам, что есть проблема с этим (и не было никаких признаков того, что я был чем-то переопределен), он разбивает Класс HTMLParser.

Ответ 3

Вам нужно вызвать init в суперклассе HTMLParser.

Вы также можете сделать это с помощью

class MLStripper(HTMLParser):
    def __init__(self):
        super(MLStripper, self).__init__()
        set()
        self.fed = []