Как выбрать библиотеку для визуализации данных в Python
Когда я только начинал работать с данными, выбор библиотеки для визуализации был настоящей головной болью. Matplotlib казался слишком сложным, Seaborn — слишком ограниченным, а Plotly пугал интерактивностью, которая мне вроде бы и не нужна. После десятка проектов я разобрался, что к чему, и теперь делюсь своими выводами, чтобы вы не тратили время на те же грабли.
Читать дальшеКак оптимизировать Python-скрипты для обработки больших данных
Работа с большими данными в Python — это всегда баланс между скоростью, памятью и читаемостью кода. Недавно я столкнулся с задачей обработки логов веб-сервера размером в несколько гигабайт, и, честно говоря, мой первый скрипт работал так медленно, что я успел заварить три чашки кофе, пока он завершился. В этой статье поделюсь несколькими приемами, которые помогли мне ускорить обработку данных, не усложняя код до состояния «кто это вообще писал?».
Читать дальше