In [7]:
import pandas as pd
data_frame = pd.read_csv('filename.csv', sep=';')
data_frame
Когда вы обрабатываете CSV с помощью pandas, вы получаете объект под названием DataFrame
, который состоит из строк и столбцов. Обратиет внимание, что в out
выводится интерактивная таблица, в которой можно например сортировать данные и при этом исходный DataFrame
не измениться. Вы можете получать столбцы таким же образом, каким получаете элементы словаря.
In [3]:
print(data_frame.keys())
print(data_frame['x'])
Добавить колонку можно как для обычного словаря:
In [4]:
import numpy as np
data_frame['t'] = np.random.randint(0, 3, size = len(data_frame['x']))
data_frame
Можно сортировать строки:
In [9]:
print(data_frame.sort_values(by=['t']))
Или группировать с нахождением среднего:
In [10]:
print(data_frame.groupby(['t']).mean())
Применять функции к столбцам:
In [11]:
data_frame['u'] = data_frame['t'].apply(lambda x: x+5)
print(data_frame)
Записывать в файл (подробнее можно почитать здесь):
In [12]:
data_frame.to_csv('filename_result.csv', index=False, sep=';')