Pandas - это мощная библиотека для Python, специально разработанная для анализа и обработки данных. Она отличается быстродействием и позволяет эффективно исследовать данные.
Эта серия статей направлена на предоставление практических примеров применения pandas.
Быстрый старт с IPython Notebook
Для максимальной продуктивности советую попробовать выполнить это в интерактиве. Начнем с установки ipython через pip:
sudo pip3 install jupyter pandas matplotlib
После установки можно легко запустить сессию ipython, набрав в терминале:
jupyter notebook
Браузер откроет сервер jupyter, откуда мы можем создать новый notebook на Python 3.
Сначала запускаем код из ячейки.
import pandas as pd
print("Hi! This is a cell. Press the ▶ button above to run it")
Hi! This is a cell. Press the ▶ button above to run it
Вы также можете использовать сочетание клавиш Ctrl+Enter, чтобы исполнять код в ячейке.
Одним из ключевых преимуществ IPython Notebook является функция автодополнения.
Попробуйте сделать следующее: после ввода read_csv( в ячейке, нажимайте Shift+Tab 4 раза медленно. Наблюдайте за результатом.
pd.read_csv(
Результат после двух повторений:

Теперь попробуем автодополнение. Введите "pd.r" и посмотрите на предложенные варианты.
pd.r
Ожидать стоит следующего:

Написание кода
Процесс написания кода в ячейках вполне интуитивен и естественен.
def print_10_nums():
for i in range(10):
print(i, end=' ')
print_10_nums()
0 1 2 3 4 5 6 7 8 9
Магические функции
IPython предлагает множество магических
функций. В качестве примера давайте сравним выполнение sum() при помощи
генератора списка и через итератор с использованием магической функции %time.
%time sum([x for x in range(100000)])
CPU times: user 20 ms, sys: 0 ns, total: 20 ms
Wall time: 18.5 ms
4999950000
%time sum(x for x in range(100000))
CPU times: user 8 ms, sys: 0 ns, total: 8 ms
Wall time: 8.34 ms
4999950000