Я хочу использовать файлы excel для хранения данных, разработанных с помощью python. Моя проблема в том, что я не могу добавить листы в существующий файл excel. Здесь я предлагаю пример кода для работы, чтобы решить эту проблему.
import pandas as pd
import numpy as np
path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"
x1 = np.random.randn(100, 2)
df1 = pd.DataFrame(x1)
x2 = np.random.randn(100, 2)
df2 = pd.DataFrame(x2)
writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df1.to_excel(writer, sheet_name = 'x1')
df2.to_excel(writer, sheet_name = 'x2')
writer.save()
writer.close()
Этот код сохраняет два DataFrames на два листа с именами "x1" и "x2" соответственно. Если я создаю два новых DataFrames и попытаюсь использовать один и тот же код для добавления двух новых листов "x3" и "x4", исходные данные будут потеряны.
import pandas as pd
import numpy as np
path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"
x3 = np.random.randn(100, 2)
df3 = pd.DataFrame(x3)
x4 = np.random.randn(100, 2)
df4 = pd.DataFrame(x4)
writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df3.to_excel(writer, sheet_name = 'x3')
df4.to_excel(writer, sheet_name = 'x4')
writer.save()
writer.close()
Мне нужен файл excel с четырьмя листами: 'x1', 'x2', 'x3', 'x4'. Я знаю, что "xlsxwriter" - не единственный "движок", есть "openpyxl". Я также видел, что есть уже другие люди, которые писали об этой проблеме, но все же я не могу понять, как это сделать.
Вот код, взятый из этой ссылки
import pandas
from openpyxl import load_workbook
book = load_workbook('Masterfile.xlsx')
writer = pandas.ExcelWriter('Masterfile.xlsx', engine='openpyxl')
writer.book = book
writer.sheets = dict((ws.title, ws) for ws in book.worksheets)
data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2'])
writer.save()
Говорят, что это работает, но трудно понять, как это сделать. Я не понимаю, что в этом контексте "ws.title", "ws" и "dict".
Каков наилучший способ сохранить "x1" и "x2", затем закройте файл, откройте его снова и добавьте "x3" и "x4"?