Функция таймаута, если требуется слишком много времени для завершения

У меня есть оболочка script, которая проходит через текстовый файл, содержащий URL: s, который я хочу посетить, и сделайте скриншоты.

Все это делается и просто. script инициализирует класс, который при запуске создает скриншот каждого сайта в списке. Некоторые сайты занимают очень и очень много времени для загрузки, а некоторые могут вообще не загружаться. Поэтому я хочу обернуть функцию screengrabber в тайм-аут script, сделав функцию return False, если она не сможет закончить в течение 10 секунд.

Мне нравится самое простое решение, возможно, установка асинхронного таймера, который вернет False через 10 секунд независимо от того, что на самом деле происходит внутри функции?

Ответ 1

Процесс тайминга операций описан в документации для signal.

Основная идея состоит в том, чтобы использовать обработчики сигналов для установки тревоги на некоторый временной интервал и поднять исключение после истечения этого таймера.

Обратите внимание, что это будет работать только в UNIX.

Здесь реализована реализация, которая создает декоратор (сохраните следующий код как timeout.py).

from functools import wraps
import errno
import os
import signal

class TimeoutError(Exception):
    pass

def timeout(seconds=10, error_message=os.strerror(errno.ETIME)):
    def decorator(func):
        def _handle_timeout(signum, frame):
            raise TimeoutError(error_message)

        def wrapper(*args, **kwargs):
            signal.signal(signal.SIGALRM, _handle_timeout)
            signal.alarm(seconds)
            try:
                result = func(*args, **kwargs)
            finally:
                signal.alarm(0)
            return result

        return wraps(func)(wrapper)

    return decorator

Это создает декоратор под названием @timeout, который может быть применен к любым длительным функциям.

Итак, в коде приложения вы можете использовать декоратор следующим образом:

from timeout import timeout

# Timeout a long running function with the default expiry of 10 seconds.
@timeout
def long_running_function1():
    ...

# Timeout after 5 seconds
@timeout(5)
def long_running_function2():
    ...

# Timeout after 30 seconds, with the error "Connection timed out"
@timeout(30, os.strerror(errno.ETIMEDOUT))
def long_running_function3():
    ...

Ответ 2

Я переписал ответ Дэвида с помощью инструкции with, это позволяет вам сделать это:

with timeout(seconds=3):
    time.sleep(4)

Что вызовет TimeoutError.

Код по-прежнему использует signal и, таким образом, только UNIX:

import signal

class timeout:
    def __init__(self, seconds=1, error_message='Timeout'):
        self.seconds = seconds
        self.error_message = error_message
    def handle_timeout(self, signum, frame):
        raise TimeoutError(self.error_message)
    def __enter__(self):
        signal.signal(signal.SIGALRM, self.handle_timeout)
        signal.alarm(self.seconds)
    def __exit__(self, type, value, traceback):
        signal.alarm(0)