Как проверить, является ли строка числом (float)?

Каков наилучший способ проверить, может ли строка быть представлена ​​в виде числа в Python?

Теперь у меня есть функция:

def is_number(s):
    try:
        float(s)
        return True
    except ValueError:
        return False

Который, не только уродливый и медленный, кажется неуклюжим. Однако я не нашел лучшего метода, потому что вызов float в основной функции еще хуже.

Ответ 1

Что не только уродливо и медленно

Я бы оспорил оба.

Регулярное выражение или другой метод синтаксического анализа строк будет более уродливым и медленным.

Я не уверен, что все может быть быстрее, чем выше. Вызывает функцию и возвращает. Try/Catch не создает больших накладных расходов, поскольку наиболее распространенное исключение перехватывается без расширенного поиска кадров стека.

Проблема в том, что любая функция преобразования чисел имеет два вида результатов

  • Номер, если номер действительный
  • Код состояния (например, через errno) или исключение, показывающее, что не может быть проанализировано действительное число.

C (в качестве примера) взломает это несколькими способами. Python излагает это ясно и явно.

Я думаю, что ваш код для этого идеально подходит.

Ответ 2

Если вы ищете синтаксические (положительные, беззнаковые) целые числа вместо чисел с плавающей точкой, вы можете использовать функцию isdigit() для строковых объектов.

>>> a = "03523"
>>> a.isdigit()
True
>>> b = "963spam"
>>> b.isdigit()
False

Строковые методы - isdigit(): Python2, Python3

Есть также кое-что о строках Unicode, с которыми я не слишком знаком Юникод - десятичный/десятичный

Ответ 3

TL; DR Лучшее решение - s.replace('.','',1).isdigit()

Я сделал некоторые тесты, сравнивающие разные подходы

def is_number_tryexcept(s):
    """ Returns True is string is a number. """
    try:
        float(s)
        return True
    except ValueError:
        return False

import re    
def is_number_regex(s):
    """ Returns True is string is a number. """
    if re.match("^\d+?\.\d+?$", s) is None:
        return s.isdigit()
    return True


def is_number_repl_isdigit(s):
    """ Returns True is string is a number. """
    return s.replace('.','',1).isdigit()

Если строка не является числом, блок except выполняется довольно медленно. Но что более важно, метод try-except - единственный подход, который правильно обрабатывает научные обозначения.

funcs = [
          is_number_tryexcept, 
          is_number_regex,
          is_number_repl_isdigit
          ]

a_float = '.1234'

print('Float notation ".1234" is not supported by:')
for f in funcs:
    if not f(a_float):
        print('\t -', f.__name__)

Обозначение с плавающей запятой ".1234" не поддерживается:
- is_number_regex

scientific1 = '1.000000e+50'
scientific2 = '1e50'


print('Scientific notation "1.000000e+50" is not supported by:')
for f in funcs:
    if not f(scientific1):
        print('\t -', f.__name__)




print('Scientific notation "1e50" is not supported by:')
for f in funcs:
    if not f(scientific2):
        print('\t -', f.__name__)

Научная нотация "1.000000e + 50" не поддерживается:
- is_number_regex
- is_number_repl_isdigit
Научная нотация "1e50" не поддерживается:
- is_number_regex
- is_number_repl_isdigit

EDIT: результаты тестов

import timeit

test_cases = ['1.12345', '1.12.345', 'abc12345', '12345']
times_n = {f.__name__:[] for f in funcs}

for t in test_cases:
    for f in funcs:
        f = f.__name__
        times_n[f].append(min(timeit.Timer('%s(t)' %f, 
                      'from __main__ import %s, t' %f)
                              .repeat(repeat=3, number=1000000)))

где были протестированы следующие функции:

from re import match as re_match
from re import compile as re_compile

def is_number_tryexcept(s):
    """ Returns True is string is a number. """
    try:
        float(s)
        return True
    except ValueError:
        return False

def is_number_regex(s):
    """ Returns True is string is a number. """
    if re_match("^\d+?\.\d+?$", s) is None:
        return s.isdigit()
    return True


comp = re_compile("^\d+?\.\d+?$")    

def compiled_regex(s):
    """ Returns True is string is a number. """
    if comp.match(s) is None:
        return s.isdigit()
    return True


def is_number_repl_isdigit(s):
    """ Returns True is string is a number. """
    return s.replace('.','',1).isdigit()

введите описание изображения здесь

Ответ 4

Есть одно исключение, которое вы можете принять во внимание: строка "NaN"

Если вы хотите, чтобы is_number возвращал FALSE для "NaN", этот код не будет работать, поскольку Python преобразует его в свое представление числа, которое не является числом (говорить о проблемах с идентификацией):

>>> float('NaN')
nan

В противном случае, я должен поблагодарить вас за кусок кода, который я сейчас широко использую.:)

G.

Ответ 5

как насчет этого:

'3.14'.replace('.','',1).isdigit()

который вернет true, только если есть один или нет. в строке цифр.

'3.14.5'.replace('.','',1).isdigit()

вернет false

edit: просто увидел другой комментарий... добавление a .replace(badstuff,'',maxnum_badstuff) для других случаев может быть выполнено. если вы пропустите соль, а не произвольные приправы (ref: xkcd # 974), это будет хорошо: P

Ответ 6

Обновлено после того, как Alfe указал, что вам не нужно отдельно проверять float как сложные дескрипторы:

def is_number(s):
    try:
        complex(s) # for int, long, float and complex
    except ValueError:
        return False

    return True

Ранее говорилось: есть ли некоторые редкие случаи, которые вам также могут понадобиться для проверки сложных чисел (например, 1 + 2i), которые не могут быть представлены с помощью float:

def is_number(s):
    try:
        float(s) # for int, long and float
    except ValueError:
        try:
            complex(s) # for complex
        except ValueError:
            return False

    return True

Ответ 7

Который, не только уродливый и медленный, кажется неуклюжим.

Это может занять некоторое время, но это питонический способ сделать это. Как уже отмечалось, альтернативы хуже. Но есть еще одно преимущество в этом: полиморфизм.

Центральная идея утиной печати заключается в том, что "если она ходит и разговаривает, как утка, то это утка". Что, если вы решите, что вам нужно подклассифицировать строку, чтобы вы могли изменить, как вы определяете, может ли что-то быть преобразовано в float? Или что, если вы решите полностью протестировать какой-либо другой объект? Вы можете делать это без изменения вышеуказанного кода.

Другие языки решают эти проблемы с помощью интерфейсов. Я сохраню анализ того, какое решение лучше для другого потока. Дело в том, что python определенно зависит от утиной печатной стороны уравнения, и вам, вероятно, придется привыкнуть к синтаксису, например, если вы планируете много программировать на Python (но это не значит вам это должно понравиться, конечно).

Еще одна вещь, которую вы, возможно, захотите принять во внимание: Python довольно быстро бросает и ломает исключения по сравнению со многими другими языками (в 30 раз быстрее, чем .NET). Черт возьми, сам язык даже создает исключения для передачи не исключительных нормальных условий программы (каждый раз, когда вы используете цикл for). Таким образом, я не стал бы слишком беспокоиться об аспектах производительности этого кода, пока вы не заметите существенную проблему.

Ответ 8

Для int используйте это:

>>> "1221323".isdigit()
True

Но для float нам нужны некоторые трюки;-). Каждое число с плавающей точкой имеет одну точку...

>>> "12.34".isdigit()
False
>>> "12.34".replace('.','',1).isdigit()
True
>>> "12.3.4".replace('.','',1).isdigit()
False

Также для отрицательных чисел просто добавьте lstrip():

>>> '-12'.lstrip('-')
'12'

И теперь мы получаем универсальный способ:

>>> '-12.34'.lstrip('-').replace('.','',1).isdigit()
True
>>> '.-234'.lstrip('-').replace('.','',1).isdigit()
False

Ответ 9

Просто Mimic С#

В С# существуют две различные функции, которые обрабатывают разбор скалярных значений:

  • Float.Parse()
  • Float.TryParse()

float.parse():

def parse(string):
    try:
        return float(string)
    except Exception:
        throw TypeError

Примечание. Если вам интересно, почему я изменил исключение на TypeError, здесь документацию.

float.try_parse():

def try_parse(string, fail=None):
    try:
        return float(string)
    except Exception:
        return fail;

Примечание. Вы не хотите возвращать логическое значение "False", потому что это еще тип значения. Нет лучше, потому что это указывает на сбой. Конечно, если вы хотите что-то другое, вы можете изменить параметр fail на все, что хотите.

Чтобы расширить float, чтобы включить "parse()" и "try_parse()", вам нужно будет обезвредить класс "float", чтобы добавить эти методы.

Если вы хотите уважать ранее существовавшие функции, код должен выглядеть примерно так:

def monkey_patch():
    if(!hasattr(float, 'parse')):
        float.parse = parse
    if(!hasattr(float, 'try_parse')):
        float.try_parse = try_parse

SideNote: Я лично предпочитаю называть это Monkey Punching, потому что кажется, что я злоупотребляю языком, когда я это делаю, но YMMV.

Применение:

float.parse('giggity') // throws TypeException
float.parse('54.3') // returns the scalar value 54.3
float.tryParse('twank') // returns None
float.tryParse('32.2') // returns the scalar value 32.2

И великий мудрец Пифон сказал Священному Престолу Шарпису: "Все, что вы можете сделать, я могу сделать лучше, я могу сделать что-нибудь лучше вас".

Ответ 10

Для строк не чисел, try: except: на самом деле медленнее, чем регулярные выражения. Для строк допустимых чисел регулярное выражение работает медленнее. Таким образом, соответствующий метод зависит от вашего ввода.

Если вы обнаружите, что находитесь в привязке к производительности, вы можете использовать новый сторонний модуль под названием fastnumbers, который обеспечивает функция называется isfloat. Полное раскрытие, я автор. Я включил его результаты в тайминги ниже.


from __future__ import print_function
import timeit

prep_base = '''\
x = 'invalid'
y = '5402'
z = '4.754e3'
'''

prep_try_method = '''\
def is_number_try(val):
    try:
        float(val)
        return True
    except ValueError:
        return False

'''

prep_re_method = '''\
import re
float_match = re.compile(r'[-+]?\d*\.?\d+(?:[eE][-+]?\d+)?$').match
def is_number_re(val):
    return bool(float_match(val))

'''

fn_method = '''\
from fastnumbers import isfloat

'''

print('Try with non-number strings', timeit.timeit('is_number_try(x)',
    prep_base + prep_try_method), 'seconds')
print('Try with integer strings', timeit.timeit('is_number_try(y)',
    prep_base + prep_try_method), 'seconds')
print('Try with float strings', timeit.timeit('is_number_try(z)',
    prep_base + prep_try_method), 'seconds')
print()
print('Regex with non-number strings', timeit.timeit('is_number_re(x)',
    prep_base + prep_re_method), 'seconds')
print('Regex with integer strings', timeit.timeit('is_number_re(y)',
    prep_base + prep_re_method), 'seconds')
print('Regex with float strings', timeit.timeit('is_number_re(z)',
    prep_base + prep_re_method), 'seconds')
print()
print('fastnumbers with non-number strings', timeit.timeit('isfloat(x)',
    prep_base + 'from fastnumbers import isfloat'), 'seconds')
print('fastnumbers with integer strings', timeit.timeit('isfloat(y)',
    prep_base + 'from fastnumbers import isfloat'), 'seconds')
print('fastnumbers with float strings', timeit.timeit('isfloat(z)',
    prep_base + 'from fastnumbers import isfloat'), 'seconds')
print()

Try with non-number strings 2.39108395576 seconds
Try with integer strings 0.375686168671 seconds
Try with float strings 0.369210958481 seconds

Regex with non-number strings 0.748660802841 seconds
Regex with integer strings 1.02021503448 seconds
Regex with float strings 1.08564686775 seconds

fastnumbers with non-number strings 0.174362897873 seconds
fastnumbers with integer strings 0.179651021957 seconds
fastnumbers with float strings 0.20222902298 seconds

Как вы можете видеть

  • try: except: был быстрым для числового ввода, но очень медленным для недопустимого ввода
  • regex очень эффективен, когда вход недействителен
  • fastnumbers выигрывает в обоих случаях

Ответ 11

Я знаю, что это особенно старый, но я бы добавил ответ, который, как я полагаю, охватывает информацию, отсутствующую в самом высоком голосовом ответе, который может быть очень ценным для тех, кто найдет это:

Для каждого из следующих методов соедините их со счетчиком, если вам нужен какой-либо ввод, который будет принят. (Предполагая, что мы используем голосовые определения целых чисел, а не 0-255 и т.д.)

x.isdigit() хорошо работает для проверки того, является ли x целым числом.

x.replace('-','').isdigit() хорошо работает для проверки того, является ли x отрицательным. (Первая запись в первой позиции)

x.replace('.','').isdigit() хорошо работает для проверки, является ли x десятичным.

x.replace(':','').isdigit() хорошо работает для проверки, является ли x отношением.

x.replace('/','',1).isdigit() хорошо работает для проверки того, является ли x дробной.

Ответ 12

Кастинг для float и catching ValueError, вероятно, самый быстрый способ, поскольку float() специально предназначен именно для этого. Все, что требует синтаксического анализа строк (regex и т.д.), Скорее всего, будет медленнее из-за того, что он не настроен для этой операции. Мои $0,02.

Ответ 14

Этот ответ предоставляет пошаговое руководство, в котором функция с примерами для поиска строки:

  • Положительное число
  • Положительный/отрицательный - integer/float
  • Как отбросить строки "NaN" (не число) при проверке номера?

Проверьте, является ли строка положительным целым числом

Вы можете использовать str.isdigit() чтобы проверить, является ли данная строка положительным целым числом.

Примеры результатов:

# For digit
>>> '1'.isdigit()
True
>>> '1'.isalpha()
False

Проверьте, что строка положительная/отрицательная - integer/float

str.isdigit() возвращает False если строка является отрицательным числом или числом с плавающей точкой. Например:

# returns 'False' for float
>>> '123.3'.isdigit()
False
# returns 'False' for negative number
>>> '-123'.isdigit()
False

Если вы хотите также проверить отрицательные целые числа и float, вы можете написать пользовательскую функцию, чтобы проверить ее как:

def is_number(n):
    try:
        float(n)   # Type-casting the string to 'float'.
                   # If string is not a valid 'float', 
                   # it'll raise 'ValueError' exception
    except ValueError:
        return False
    return True

Пример прогона:

>>> is_number('123')    # positive integer number
True

>>> is_number('123.4')  # positive float number
True

>>> is_number('-123')   # negative integer number
True

>>> is_number('-123.4') # negative 'float' number
True

>>> is_number('abc')    # 'False' for "some random" string
False

Отбросьте строки "NaN" (не число) при проверке номера

Вышеупомянутые функции вернут True для строки "NAN" (Not number), потому что для Python это допустимое значение float, представляющее его, не является числом. Например:

>>> is_number('NaN')
True

Чтобы проверить, является ли число "NaN", вы можете использовать math.isnan() как:

>>> import math
>>> nan_num = float('nan')

>>> math.isnan(nan_num)
True

Или если вы не хотите импортировать дополнительную библиотеку, чтобы проверить это, вы можете просто проверить ее, сравнив ее с самим собой, используя ==. Python возвращает False когда nan float сравнивается с самим собой. Например:

# 'nan_num' variable is taken from above example
>>> nan_num == nan_num
False

Следовательно, выше функция is_number может быть обновлена, чтобы вернуть False для "NaN" следующим образом:

def is_number(n):
    is_number = True
    try:
        num = float(n)
        # check for "nan" floats
        is_number = num == num   # or use 'math.isnan(num)'
    except ValueError:
        is_number = False
    return is_number

Пример прогона:

>>> is_number('Nan')   # not a number "Nan" string
False

>>> is_number('nan')   # not a number string "nan" with all lower cased
False

>>> is_number('123')   # positive integer
True

>>> is_number('-123')  # negative integer
True

>>> is_number('-1.12') # negative 'float'
True

>>> is_number('abc')   # "some random" string
False

PS: Каждая операция для каждой проверки в зависимости от типа номера имеет дополнительные накладные расходы. Выберите версию функции is_number которая соответствует вашим требованиям.

Ответ 15

Я хотел бы узнать, какой метод наиболее быстрый. В целом лучшие и наиболее последовательные результаты были заданы функцией check_replace. Самые быстрые результаты были заданы функцией check_exception, но только если исключение не было выпущено - это означает, что его код является наиболее эффективным, но накладные расходы на выброс исключения довольно велики.

Обратите внимание, что проверка на успешное выполнение является единственным методом, который является точным, например, это работает с check_exception но две другие тестовые функции возвращают False для действительного float:

huge_number = float('1e+100')

Вот эталонный код:

import time, re, random, string

ITERATIONS = 10000000

class Timer:    
    def __enter__(self):
        self.start = time.clock()
        return self
    def __exit__(self, *args):
        self.end = time.clock()
        self.interval = self.end - self.start

def check_regexp(x):
    return re.compile("^\d*\.?\d*$").match(x) is not None

def check_replace(x):
    return x.replace('.','',1).isdigit()

def check_exception(s):
    try:
        float(s)
        return True
    except ValueError:
        return False

to_check = [check_regexp, check_replace, check_exception]

print('preparing data...')
good_numbers = [
    str(random.random() / random.random()) 
    for x in range(ITERATIONS)]

bad_numbers = ['.' + x for x in good_numbers]

strings = [
    ''.join(random.choice(string.ascii_uppercase + string.digits) for _ in range(random.randint(1,10)))
    for x in range(ITERATIONS)]

print('running test...')
for func in to_check:
    with Timer() as t:
        for x in good_numbers:
            res = func(x)
    print('%s with good floats: %s' % (func.__name__, t.interval))
    with Timer() as t:
        for x in bad_numbers:
            res = func(x)
    print('%s with bad floats: %s' % (func.__name__, t.interval))
    with Timer() as t:
        for x in strings:
            res = func(x)
    print('%s with strings: %s' % (func.__name__, t.interval))

Вот результаты с Python 2.7.10 на MacBook Pro 201:

check_regexp with good floats: 12.688639
check_regexp with bad floats: 11.624862
check_regexp with strings: 11.349414
check_replace with good floats: 4.419841
check_replace with bad floats: 4.294909
check_replace with strings: 4.086358
check_exception with good floats: 3.276668
check_exception with bad floats: 13.843092
check_exception with strings: 15.786169

Вот результаты с Python 3.6.5 на MacBook Pro 201:

check_regexp with good floats: 13.472906000000009
check_regexp with bad floats: 12.977665000000016
check_regexp with strings: 12.417542999999995
check_replace with good floats: 6.011045999999993
check_replace with bad floats: 4.849356
check_replace with strings: 4.282754000000011
check_exception with good floats: 6.039081999999979
check_exception with bad floats: 9.322753000000006
check_exception with strings: 9.952595000000002

Ниже приведены результаты с PyPy 2.7.13 на MacBook Pro 201:

check_regexp with good floats: 2.693217
check_regexp with bad floats: 2.744819
check_regexp with strings: 2.532414
check_replace with good floats: 0.604367
check_replace with bad floats: 0.538169
check_replace with strings: 0.598664
check_exception with good floats: 1.944103
check_exception with bad floats: 2.449182
check_exception with strings: 2.200056

Ответ 16

Итак, чтобы собрать все вместе, проверив Nan, бесконечность и комплексные числа (казалось бы, они указаны с j, а не i, то есть 1 + 2j), это приводит к:

def is_number(s):
    try:
        n=str(float(s))
        if n == "nan" or n=="inf" or n=="-inf" : return False
    except ValueError:
        try:
            complex(s) # for complex
        except ValueError:
            return False
    return True

Ответ 17

Допустим, у вас есть цифры в строке. str = "100949" и вы хотите проверить, есть ли у него только числа

if str.isdigit():
returns TRUE or FALSE 

isdigit docs

в противном случае ваш метод отлично работает, чтобы найти появление цифры в строке.

Ответ 18

Ваш код выглядит хорошо для меня.

Возможно, вы считаете, что код "неуклюжий" из-за использования исключений? Обратите внимание, что программисты Python склонны использовать исключения либерально, когда улучшают удобочитаемость кода благодаря его низкой производительности.

Ответ 19

Я сделал несколько тестов скорости. Предположим, что если строка вероятна является числом, стратегия try/except является самой быстрой. Если строка не вероятна как число и, вас интересует проверка Integer, стоит сделать какой-то тест (isdigit plus heading '-'). Если вам интересно проверить число с плавающей запятой, вам нужно использовать escape/исключение кода без выхода.

Ответ 20

Мне нужно было определить, была ли строка передана в базовые типы (float, int, str, bool). После того, как я ничего не нашел в Интернете, я создал это:

def str_to_type (s):
    """ Get possible cast type for a string

    Parameters
    ----------
    s : string

    Returns
    -------
    float,int,str,bool : type
        Depending on what it can be cast to

    """    
    try:                
        f = float(s)        
        if "." not in s:
            return int
        return float
    except ValueError:
        value = s.upper()
        if value == "TRUE" or value == "FALSE":
            return bool
        return type(s)

Пример

str_to_type("true") # bool
str_to_type("6.0") # float
str_to_type("6") # int
str_to_type("6abc") # str
str_to_type(u"6abc") # unicode       

Вы можете захватить тип и использовать его

s = "6.0"
type_ = str_to_type(s) # float
f = type_(s) 

Ответ 21

Ввод может быть следующим:

a="50" b=50 c=50.1 d="50.1"


1-Общий вход:

Ввод этой функции может быть любым!

Находит, является ли данная переменная числовой. Числовые строки состоят из необязательного знака, любого количества цифр, необязательной десятичной части и необязательной экспоненциальной части. Таким образом, +0123.45e6 является допустимым числовым значением. Шестнадцатеричная (например, 0xf4c3b00c) и двоичная (например, 0b10100111001) нотация не допускается.

is_numeric функция

import ast
import numbers              
def is_numeric(obj):
    if isinstance(obj, numbers.Number):
        return True
    elif isinstance(obj, str):
        nodes = list(ast.walk(ast.parse(obj)))[1:]
        if not isinstance(nodes[0], ast.Expr):
            return False
        if not isinstance(nodes[-1], ast.Num):
            return False
        nodes = nodes[1:-1]
        for i in range(len(nodes)):
            #if used + or - in digit :
            if i % 2 == 0:
                if not isinstance(nodes[i], ast.UnaryOp):
                    return False
            else:
                if not isinstance(nodes[i], (ast.USub, ast.UAdd)):
                    return False
        return True
    else:
        return False

тестовое задание:

>>> is_numeric("54")
True
>>> is_numeric("54.545")
True
>>> is_numeric("0x45")
True

функция is_float

Находит, является ли данная переменная плавающей. Строки float состоят из необязательного знака, любого количества цифр,...

import ast

def is_float(obj):
    if isinstance(obj, float):
        return True
    if isinstance(obj, int):
        return False
    elif isinstance(obj, str):
        nodes = list(ast.walk(ast.parse(obj)))[1:]
        if not isinstance(nodes[0], ast.Expr):
            return False
        if not isinstance(nodes[-1], ast.Num):
            return False
        if not isinstance(nodes[-1].n, float):
            return False
        nodes = nodes[1:-1]
        for i in range(len(nodes)):
            if i % 2 == 0:
                if not isinstance(nodes[i], ast.UnaryOp):
                    return False
            else:
                if not isinstance(nodes[i], (ast.USub, ast.UAdd)):
                    return False
        return True
    else:
        return False

тестовое задание:

>>> is_float("5.4")
True
>>> is_float("5")
False
>>> is_float(5)
False
>>> is_float("5")
False
>>> is_float("+5.4")
True

что такое аст?


2- Если вы уверены, что переменным содержимым является строка:

использовать метод str.isdigit()

>>> a=454
>>> a.isdigit()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'int' object has no attribute 'isdigit'
>>> a="454"
>>> a.isdigit()
True

3-числовой вход:

определить значение int:

>>> isinstance("54", int)
False
>>> isinstance(54, int)
True
>>> 

обнаружить поплавок:

>>> isinstance("45.1", float)
False
>>> isinstance(45.1, float)
True

Ответ 22

РайанН предлагает

Если вы хотите вернуть False для NaN и Inf, измените строку на x = float (s); return (x == x) и (x - 1!= x). Это должно возвращать True для всех поплавков, кроме Inf и NaN

Но это не совсем работает, потому что для достаточно больших поплавок x-1 == x возвращает true. Например, 2.0**54 - 1 == 2.0**54

Ответ 23

Я думаю, что ваше решение в порядке.

Сказав это, есть много ненависти регулярных выражений к этим ответам, которые я считаю неоправданными, регулярные выражения могут быть достаточно чистыми, правильными и быстрыми. Это действительно зависит от того, что вы пытаетесь сделать. Первоначальный вопрос заключался в том, как можно "проверить, можно ли представить строку в виде числа (с плавающей запятой)" (согласно вашему названию). Предположительно, вы захотите использовать числовое значение/значение с плавающей запятой после того, как вы проверите, что оно действительно, и в этом случае ваши попытки/кроме имеют большой смысл. Но если по какой-то причине вы просто хотите проверить, что строка является числом, тогда регулярное выражение также работает нормально, но его трудно получить правильно. Я думаю, что большинство ответов на регулярные выражения до сих пор, например, неправильно анализируют строки без целочисленной части (такой как ".7"), которая является плавающей точкой в том, что касается python. И это немного сложно проверить в одном регулярном выражении, где дробная часть не требуется. Я включил два регулярных выражения, чтобы показать это.

Это поднимает интересный вопрос о том, что такое "число". Вы включаете "inf", который является допустимым как float в python? Или вы включаете числа, которые являются "числами", но, возможно, не могут быть представлены в Python (например, числа, которые больше, чем максимум с плавающей точкой).

Там также двусмысленности в том, как вы анализируете числа. Например, что насчет "--20"? Это "число"? Это законный способ представлять "20"? Python позволит вам сделать "var = --20" и установить его равным 20 (хотя на самом деле это происходит потому, что он обрабатывает это как выражение), но float ("--20") не работает.

В любом случае, без дополнительной информации, здесь регулярное выражение, которое, как я считаю, охватывает все целые числа и числа с плавающей запятой, когда python анализирует их.

# Doesn't properly handle floats missing the integer part, such as ".7"
SIMPLE_FLOAT_REGEXP = re.compile(r'^[-+]?[0-9]+\.?[0-9]+([eE][-+]?[0-9]+)?$')
# Example "-12.34E+56"      # sign (-)
                            #     integer (12)
                            #           mantissa (34)
                            #                    exponent (E+56)

# Should handle all floats
FLOAT_REGEXP = re.compile(r'^[-+]?([0-9]+|[0-9]*\.[0-9]+)([eE][-+]?[0-9]+)?$')
# Example "-12.34E+56"      # sign (-)
                            #     integer (12)
                            #           OR
                            #             int/mantissa (12.34)
                            #                            exponent (E+56)

def is_float(str):
  return True if FLOAT_REGEXP.match(str) else False

Некоторые примеры тестовых значений:

True  <- +42
True  <- +42.42
False <- +42.42.22
True  <- +42.42e22
True  <- +42.42E-22
False <- +42.42e-22.8
True  <- .42
False <- 42nope

Ответ 24

Вы можете использовать регулярное выражение.

number = raw_input("Enter a number: ")
if re.match(r'^\d+$', number):
    print "It integer"
    print int(number)
elif re.match(r'^\d+\.\d+$', number):
    print "It float"
    print float(number)
else:
    print("Please enter a number")

Ответ 25

Я также использовал указанную вами функцию, но вскоре я заметил, что строки как "Нан", "Инф" и ее вариация считаются цифрами. Поэтому я предлагаю вам улучшенную версию вашей функции, которая вернет false для этих типов ввода и не выйдет из строя "1e3" вариантов:

def is_float(text):
    try:
        float(text)
        # check for nan/infinity etc.
        if text.isalpha():
            return False
        return True
    except ValueError:
        return False

Ответ 26

import re
def is_number(num):
    pattern = re.compile(r'^[-+]?[-0-9]\d*\.\d*|[-+]?\.?[0-9]\d*$')
    result = pattern.match(num)
    if result:
        return True
    else:
        return False


​>>>: is_number('1')
True

>>>: is_number('111')
True

>>>: is_number('11.1')
True

>>>: is_number('-11.1')
True

>>>: is_number('inf')
False

>>>: is_number('-inf')
False

Ответ 27

Этот код обрабатывает показатели, числа с плавающей точкой и целые числа, без использования регулярных выражений.

return True if str1.lstrip('-').replace('.','',1).isdigit() or float(str1) else False

Ответ 28

Если вы хотите знать, может ли вся строка быть представлена ​​в виде числа, вы хотите использовать regexp (или, возможно, преобразовать float в строку и сравнить ее с исходной строкой, но я предполагаю, что не очень быстро).

Ответ 29

Вот мой простой способ сделать это. Скажем, что я перебираю некоторые строки, и я хочу добавить их в массив, если они окажутся числами.

try:
    myvar.append( float(string_to_check) )
except:
    continue

Замените myvar.apppend любой операцией, которую вы хотите сделать с строкой, если она окажется числом. Идея состоит в том, чтобы попытаться использовать операцию float() и использовать возвращаемую ошибку, чтобы определить, является ли строка числом.

Ответ 30

Вы можете обобщить технику исключения полезным способом, возвращая более полезные значения, чем True и False. Например, эта функция ставит кавычки вокруг строк, но оставляет числа в одиночку. Это именно то, что мне нужно для быстрого и грязного фильтра, чтобы сделать некоторые определения переменных для R.

import sys

def fix_quotes(s):
    try:
        float(s)
        return s
    except ValueError:
        return '"{0}"'.format(s)

for line in sys.stdin:
    input = line.split()
    print input[0], '<- c(', ','.join(fix_quotes(c) for c in input[1:]), ')'