Чтобы загрузить данные в Pandas DataFrame из файла CSV, используйте функцию pandas.read_csv().
В этом руководстве мы изучим различные скрипты, возникающие при загрузке данных из CSV в Pandas DataFrame.
Пример 1
В этом примере мы берем следующий CSV-файл и загружаем его в DataFrame с помощью метода pandas.read_csv().
name,physics,chemistry,algebra Somu,68,84,78 Kiku,74,56,88 Amol,77,73,82 Lini,78,69,87
import pandas as pd
#load dataframe from csv
df = pd.read_csv("data.csv")
#print dataframe
print(df)
Вывод:
name physics chemistry algebra 0 Somu 68 84 78 1 Kiku 74 56 88 2 Amol 77 73 82 3 Lini 78 69 87
Первая строка в CSV-файле используется как имена столбцов, а остальные – как строки DataFrame.
Пример 2: с определенным разделителем
Если вы используете другой разделитель для различения элементов в ваших данных, вы можете указать этот разделитель для функции read_csv() с помощью аргумента разделителя.
Рассмотрим следующий файл csv. В этом CSV-файле разделителем является пробел.
name physics chemistry algebra Somu 68 84 78 Kiku 74 56 88 Amol 77 73 82 Lini 78 69 87
Теперь мы предоставим разделитель в качестве пробела для функции read_csv().
import pandas as pd
#load dataframe from csv
df = pd.read_csv('data.csv', delimiter=' ')
#print dataframe
print(df)
Вывод:
name physics chemistry algebra 0 Somu 68 84 78 1 Kiku 74 56 88 2 Amol 77 73 82 3 Lini 78 69 87
Загрузить из CSV без заголовка
Если ваш CSV-файл не имеет заголовка (имен столбцов), вы можете указать это для read_csv() двумя способами:
- Передайте аргумент header = None функции pandas.read_csv().
- Передайте имена аргументов функции pandas.read_csv(), которая неявно делает header = None.
import pandas as pd
# using header argument
df = pd.read_csv('data.csv', header=None)
# using names argument
df1 = pd.read_csv('data.csv', names=list_of_column_names)
В этом руководстве по Pandas мы узнали, как загружать данные из файла CSV в Pandas DataFrame.