Ключові моменти
| Запуск та завершення |
|
| Змінні та присвоєння |
|
| Типи даних та їх перетворення |
|
| 04 Built In |
|
| Бібліотеки |
|
| Читання табличних даних у DataFrames |
|
| Pandas DataFrames |
|
| Побудова графіків |
|
| Списки |
|
| Цикли for |
|
| Умовні оператори |
|
| Перегляд наборів даних в циклі |
|
| Написання функцій |
|
| Область видимості змінної |
|
| Стиль програмування |
|
| Підведення підсумків |
|
| Зворотній зв'язок |
|
Довідник
Запуск та завершення роботи
- Python файли мають розширення
.py. - Можуть бути створені у текстовому редакторі або у [Jupyter Notebook][jupyter].
- Файли, створені в середовищі Jupyter notebook, мають розширення
.ipynb - Файли, створені в середовищі Jupyter notebook, можуть бути відкриті в Anaconda or through the command line by entering
$ jupyter notebook- В комірках markdown для документування коду можна використовувати як Markdown так і HTML.
- Файли, створені в середовищі Jupyter notebook, мають розширення
Змінні та присвоєння
- Значення змінних зберігаються за допомогою
=.- Рядки визначаються в лапках
'...'. - Цілі числа та числа з плаваючою комою визначаються без лапок.
- Рядки визначаються в лапках
- Змінні можуть містити літери, цифри та символ підкреслення “_”.
- Не можуть починатися з цифри.
- Слід уникати змінних, які починаються з підкреслення.
- Використовуйте
print(...), щоб відобразити значення як текст. - Можна використовувати індексацію рядків.
- Індексація починається з 0.
- Позиція вказується в квадратних дужках
[position]після імені змінної. - Зріз створюється за допомогою
[start:stop]. Це робить копію частини вихідного рядка)startє індексом першого елемента.stopє індексом елемента після останнього потрібного елемента.
- Використовуйте
len(...)для визначення довжини змінної або рядка.
Типи даних та їх перетворення
- Кожна величина має тип. Це контролює дії, які можна з нею робити.
intє цілим числомfloatпредставляє число з плаваючою комою.strє рядком. Щоб визначити тип змінної, скористайтеся вбудованою функцієюtype(...), вказавши назву змінної в дужках.
- Модифікація рядків:
- Використовуйте
+для об’єднання (конкатенації) рядків. - Використовуйте
*, щоб повторити рядок. - Числа та рядки не можна додавати один до іншого.
- Перетворити рядок на ціле:
int(...). - Перетворити ціле на рядок :
str(...).
- Перетворити рядок на ціле:
- Використовуйте
Вбудовані функції та довідка
- Щоб додати коментар, поставте
#перед тим, що ви не хочете виконувати. - Вбудовані функції, які часто використовуються:
min()визначає найменшу величину.max()визначає найбільшу величину.round()округлює число з плаваючою комою.help()відображає документацію для функції в дужках.- Інші способи отримати допомогу включають одночасне натискання
shiftіtabу Jupyter Notebooks.
- Інші способи отримати допомогу включають одночасне натискання
Бібліотеки
- Імпорт бібліотеки:
- Використовуйте
import ...для підключення бібліотеки. - Звертайтеся до цієї бібліотеки у форматі
module_name.thing_name..вказує на ‘частину’.
- Використовуйте
- Щоб імпортувати певний елемент із бібліотеки, використовуйте команду
from ... import ... - Щоб імпортувати бібліотеку та створити її псевдонім, використовуйте команду
import ... as ... - Імпорт математичної бібліотеки:
import math- Приклад посилання на елемент із назвою модуля:
math.cos(math.pi).
- Приклад посилання на елемент із назвою модуля:
- Імпорт графічної бібліотеки та позначення її за допомогою псевдоніма:
import matplotlib as mpl
Читання табличних даних у фреймах даних
- Використовуйте бібліотеку pandas для статистичної обробки табличних даних. Завантажуйте її за допомогою
import pandas as pd.- Щоб прочитати дані у файлі csv, використовуйте команду:
pd.read_csv(), включаючи шлях до файлу в дужках.- Щоб указати значення стовпця, слід використовувати наступний формат заголовків рядків:
pd.read_csv('path',index_col='column name'), деpathіcolumn nameзамінюються відповідними значеннями.
- Щоб указати значення стовпця, слід використовувати наступний формат заголовків рядків:
- Щоб прочитати дані у файлі csv, використовуйте команду:
- Щоб отримати більше інформації про фрейм даних, використовуйте
DataFrame.info, замінившиDataFrameназвою вашого файлу даних. - Використовуйте команду
DataFrame.columnsщоб переглянути назви стовпців. - Використовуйте
DataFrame.Tщоб транспонувати фрейм даних. - Використовуйте
DataFrame.describe, щоб отримати підсумкову статистику ваших даних.
Pandas DataFrames
- Вибір даних за допомогою
[i,j]- Вибір за місцезнаходженням:
DataFrame.iloc[..., ...]- Це включає весь діапазон, крім останнього індексу.
- Для вибору за міткою запису використовуйте:
DataFrame.loc[..., ...]- Можна вибрати кілька рядків або стовпців визначенням діапазону міток.
- Кінцеві індекси включно з обох боків.
- Використовуйте
:, щоб обрати всі рядки або стовпці.
- Вибір за місцезнаходженням:
- Також можна вибирати дані на основі значень за допомогою
trueіfalse. Це Булева маска.- Наприклад,
mask = subset > 10000 - Ми можемо потім використовувати вище визначену маску для вибору значень.
- Наприклад,
- Формат комбінованої операції select-apply є таким:
data.apply(lambda x: x>x.mean()), деmean()може бути будь-якою операцією, яку користувач хоче застосувати до набору даних x.
Пoбудова графіків
matplotlibє найбільш широко використовуваною бібліотекою побудови графіків.- Зазвичай імпортується за допомогою
import matplotlib.pyplot as plt. - Для побудови графіків використовується команда
plt.plot(time, position). - Для створення легенди використовується команда
plt.legend(['label1','label2', loc='upper left'])- Можна також визначати мітки в операторах plot за допомогою команди
plt.plot(time, position, label='label'). Щоб відобразити легенду, використовуйтеplt.legend()
- Можна також визначати мітки в операторах plot за допомогою команди
- Для позначення осей x і y використовуються команди
plt.xlabel('label')іplt.ylabel('label').
- Зазвичай імпортується за допомогою
- Pandas DataFrames можна використовувати для побудови графіків, застосовуючи команду
DataFrame.plot(). Будь-які операції, які можна використовувати на DataFrame, можна застосовувати для побудови графіків.- Для побудови гістограми застосовуйте команду
data.plot(kind='bar')
- Для побудови гістограми застосовуйте команду
import matplotlib.puplot as plot
plt.plot(time,position,label='label')
plt.xlabel('x axis label')
plt.ylabel('y axis label')
plt.legend()
Списки
- Містяться у
[...]і розділяються за допомогою,.- Порожній список можна створити за допомогою
[].
- Порожній список можна створити за допомогою
- Можна використовувати
len(...), щоб визначити кількість значень у списку. - Можна індексувати так само, як це виконувалось в попередніх уроках.
- Індексацію можна використовувати для перепризначення значень:
назва_списку[0] = нове значення
- Індексацію можна використовувати для перепризначення значень:
- Щоб додати елемент до списку, використовуйте
list_name.append(), указавши у дужках елемент, який потрібно додати. - Щоб об’єднати два списки, використовуйте
list_name_1.extend(list_name_2). - Щоб видалити елемент зі списку, використовуйте
del list_name[index].
Цикли for
- Почніть цикл for з
for number in [1,2,3]:з відступом у наступних рядках.[1, 2, 3]розглядається як колекція.numberє змінною цикла.- Дія, наступна за колекцією, є тілом циклу.
- Для повторення послідовності дій зі змінною циклу використовуйте
range(start, end)
for number in range(0,5):
print(number)
Умовні оператори
- Визначаються подібно до циклу з використанням формату
if variable умовне значення:- Наприклад,
if variable > 5:.
- Наприклад,
- Використовуйте
elif:для додаткових тестів. - Використовуйте
else:, якщо твердження if є невірним. - Можна об’єднати більше ніж одну умову за допомогою
andабоor. - Часто використовується в поєднанні з циклами for.
- Умови, які можна використовувати:
==дорівнює.>=більше або дорівнює.<=менше або дорівнює.>більше за.<менше за.
for m in [3, 6, 7, 2, 8]:
if m > 5:
print(m, 'is large')
elif m == 5:
print(m, 'is 5')
else:
print(m, 'is small')
Перегляд наборів даних в циклі
- Використовуйте цикл for:
for filename in [file1, file2]: - Щоб знайти набір файлів за шаблоном, використовуйте
glob.glob- Спочатку потрібно імпортувати відповідну бібліотеку за допомогою
import glob. *вказує, що “нуль або більше символів збігаються”?вказує, що “тільки один символ збігається”- Наприклад:
glob.glob(*.txt)знайде всі файли з розширенням .txt у поточному каталозі.
- Наприклад:
- Спочатку потрібно імпортувати відповідну бібліотеку за допомогою
- Поєднайте це, написавши цикл за допомогою:
for filename in glob.glob(*.txt):
for filename in glob.glob(*.txt):
data = pd.read_csv(filename)
Написання функцій
- Визначайте функцію за допомогою
def function_name(parameters):. Змінітьparametersна змінні, які використовуватимуться під час виконання функції. - Запустіть функцію за допомогою
function_name(parameters). - Щоб повернути результат у місце виклику, використовуйте
return ...в тілі функції.
def add_numbers(a, b):
result = a + b
return result
add_numbers(1, 4)
Область видимості змінної
- Локальна змінна визначена у функції, і її можна побачити та використовувати лише в цій функції.
- Глобальна змінна визначається поза функцією, і її можна побачити або використати будь-де після її визначення.
Стиль програмування
- Документуйте свій код.
- Використовуйте чіткі та зрозумілі назви змінних.
- Притримуйтесь the PEP8 style guide під час налаштування коду.
- Використовуйте твердження для перевірки внутрішніх помилок.
- Використовуйте docstrings для створення довідки.
Словник
- Аргументи
- Значення, що передаються функціям.
- Масив
- контейнер, що містить елементи одного типу
- Булевий
- об’єкт, що складається з
trueіfalse - Фрейм даних
- Засіб подання таблиці у Pandas; колекція серій.
- Element
- Окреме значення у списку або масиві. Для рядка це окремі символи.
- Функція
- блок коду, який можна викликати та повторно використовувати деінде.
- Глобальна змінна
- Змінна, визначена поза функцією, яку можна використовувати будь-де.
- Індекс
- Позиція даного елемента.
- Jupyter Notebook
- Інтерактивне середовище кодування, що дозволяє поєднувати код і розмітку.
- Бібліотека
- Колекція файлів, що містять функції, які використовуються іншими програмами.
- Локальна змінна
- Змінна, визначена всередині функції, яку можна використовувати лише всередині цієї функції.
- Маска
- Булевий об’єкт, який використовується для вибору даних з іншого об’єкта.
- Метод
- Дія, пов’язана з певним об’єктом. Викликається за допомогою
object.method. - Модулі
- файли в бібліотеці, що містять функції, які використовуються іншими програмами.
- Параметри
- Змінні, що використовуються під час виконання функції.
- Серія
- Структура даних Pandas для подання стовпця.
- Підрядок
- Частина рядка.
- Змінні
- Назви значень.