В чем разница между "log" и "symlog"?

В matplotlib я могу установить масштабирование оси с помощью pyplot.xscale() или Axes.set_xscale(). Обе функции принимают три разных шкалы: 'linear' | 'log' | 'symlog'.

В чем разница между 'log' и 'symlog'? В простом тесте я сделал, они оба выглядели точно так же.

Я знаю, что в документации говорится, что они принимают разные параметры, но я до сих пор не понимаю разницы между ними. Может кто-нибудь объяснить это? Ответ будет лучшим, если у него есть образец кода и графика! (также: откуда взялось имя "symlog"?)

Ответ 1

Наконец-то я нашел некоторое время, чтобы сделать некоторые эксперименты, чтобы понять разницу между ними. Вот что я обнаружил:

  • log допускает только положительные значения и позволяет выбирать, как обращаться с отрицательными (mask или clip).
  • symlog означает симметричный журнал и допускает положительные и отрицательные значения.
  • symlog позволяет установить диапазон вокруг нуля в пределах графика будет линейным, а не логарифмическим.

Я думаю, что все будет намного легче понять с помощью графики и примеров, поэтому попробуйте их:

import numpy
from matplotlib import pyplot

# Enable interactive mode
pyplot.ion()

# Draw the grid lines
pyplot.grid(True)

# Numbers from -50 to 50, with 0.1 as step
xdomain = numpy.arange(-50,50, 0.1)

# Plots a simple linear function 'f(x) = x'
pyplot.plot(xdomain, xdomain)
# Plots 'sin(x)'
pyplot.plot(xdomain, numpy.sin(xdomain))

# 'linear' is the default mode, so this next line is redundant:
pyplot.xscale('linear')

A graph using 'linear' scaling

# How to treat negative values?
# 'mask' will treat negative values as invalid
# 'mask' is the default, so the next two lines are equivalent
pyplot.xscale('log')
pyplot.xscale('log', nonposx='mask')

A graph using 'log' scaling and nonposx='mask'

# 'clip' will map all negative values a very small positive one
pyplot.xscale('log', nonposx='clip')

A graph using 'log' scaling and nonposx='clip'

# 'symlog' scaling, however, handles negative values nicely
pyplot.xscale('symlog')

A graph using 'symlog' scaling

# And you can even set a linear range around zero
pyplot.xscale('symlog', linthreshx=20)

A graph using 'symlog' scaling, but linear within (-20,20)

Просто для полноты я использовал следующий код, чтобы сохранить каждую цифру:

# Default dpi is 80
pyplot.savefig('matplotlib_xscale_linear.png', dpi=50, bbox_inches='tight')

Помните, что вы можете изменить размер фигуры, используя:

fig = pyplot.gcf()
fig.set_size_inches([4., 3.])
# Default size: [8., 6.]

(Если вы не знаете, что я отвечаю на свой вопрос, прочитайте this)

Ответ 2

symlog похож на журнал, но позволяет определить диапазон значений около нуля, в пределах которого график является линейным, чтобы избежать заговора, идущего в бесконечность вокруг нуля.

От http://matplotlib.sourceforge.net/api/axes_api.html#matplotlib.axes.Axes.set_xscale

В графике журнала вы никогда не можете иметь нулевое значение, и если у вас есть значение, которое приближается к нулю, оно будет отскакивать вниз от вашего графика (бесконечно вниз), потому что когда вы берете "журнал (приближающийся к нулю )" вы получаете "приближающуюся отрицательную бесконечность".

symlog поможет вам в ситуациях, когда вы хотите иметь график журналов, но когда значение может иногда идти вниз или к нулю, но вы все еще хотите показать, что на графике в значимом путь. Если вам нужен симлог, вы бы знали.

Ответ 3

Вот пример поведения, когда нужен symlog:

Начальный сюжет, не масштабируется. Обратите внимание, сколько точек кластеризуются при x ~ 0

    ax = sns.scatterplot(x= 'Score', y ='Total Amount Deposited', data = df, hue = 'Predicted Category')

[Non scaled "

Лог масштабированный. Все рухнуло.

    ax = sns.scatterplot(x= 'Score', y ='Total Amount Deposited', data = df, hue = 'Predicted Category')

    ax.set_xscale('log')
    ax.set_yscale('log')
    ax.set(xlabel='Score, log', ylabel='Total Amount Deposited, log')

Log scale "

Почему он рухнул? Из-за того, что некоторые значения на оси х очень близки или равны 0.

Симлог масштабный сюжет. Все так, как и должно быть.

    ax = sns.scatterplot(x= 'Score', y ='Total Amount Deposited', data = df, hue = 'Predicted Category')

    ax.set_xscale('symlog')
    ax.set_yscale('symlog')
    ax.set(xlabel='Score, symlog', ylabel='Total Amount Deposited, symlog')

Symlog scale