import pandas as pd
path1 = "/home/supertramp/Desktop/100&life_180_data.csv"
mydf = pd.read_csv(path1)
numcigar = {"Never":0 ,"1-5 Cigarettes/day" :1,"10-20 Cigarettes/day":4}
print mydf['Cigarettes']
mydf['CigarNum'] = mydf['Cigarettes'].apply(numcigar.get).astype(float)
print mydf['CigarNum']
mydf.to_csv('/home/supertramp/Desktop/powerRangers.csv')
В файле csv "100 & life_180_data.csv" содержатся такие столбцы, как возраст, bmi, сигареты, Alocohol и т.д.
No int64
Age int64
BMI float64
Alcohol object
Cigarettes object
dtype: object
Сигаретная колонка содержит "Никогда" "1-5 Сигареты/день", "10-20 сигарет/день". Я хочу присвоить весу этим объектам (Никогда, 1-5 Cigarettes/day,....)
Ожидаемый вывод - это новый столбец CigarNum, который содержит только числа 0,1,2 CigarNum как ожидается до 8 строк, а затем показывает Nan до последнего ряда в столбце CigarNum
0 Never
1 Never
2 1-5 Cigarettes/day
3 Never
4 Never
5 Never
6 Never
7 Never
8 Never
9 Never
10 Never
11 Never
12 10-20 Cigarettes/day
13 1-5 Cigarettes/day
14 Never
...
167 Never
168 Never
169 10-20 Cigarettes/day
170 Never
171 Never
172 Never
173 Never
174 Never
175 Never
176 Never
177 Never
178 Never
179 Never
180 Never
181 Never
Name: Cigarettes, Length: 182, dtype: object
Результат, который я получаю, не дает NaN после нескольких первых строк.
0 0
1 0
2 1
3 0
4 0
5 0
6 0
7 0
8 0
9 0
10 NaN
11 NaN
12 NaN
13 NaN
14 0
...
167 NaN
168 NaN
169 NaN
170 NaN
171 NaN
172 NaN
173 NaN
174 NaN
175 NaN
176 NaN
177 NaN
178 NaN
179 NaN
180 NaN
181 NaN
Name: CigarNum, Length: 182, dtype: float64