Массовая загрузка, объединение и преобразование нескольких csv файлов с помощью Python
Сегодня в меню - начальная обработка данных с помощью Python: автоматически загружаем, преобразовываем и склеиваем несколько csv файлов в одну таблицу, а так же добавляем парочку преобразований Посвящается людям, которым до сих пор приходится вручную склеивать однотипные таблицы между собой - этот несложный приём когда-то существенно улучшил жизнь мне, уверена - улучшит и вам :) В этом видео мы безжалостно эксплуатировали (в основном) Pandas ради оптовой загрузки csv файлов и их преобразования в один удобный датафрейм, а затем меняли его структуру и выгружали обратно 00:00 Интро 00:22 Получение подопытных файлов для будущего датасета с помощью GoogleTrends 03:06 Импорт библиотек и загрузка отдельного файла 04:43 Массовая загрузка файлов, проверка типа файла при загрузке 05:57 Получение данных из загруженных файлов по умолчанию 07:31 Получение данных из загруженных файлов с добавлением дополнительных параметров 10:37 Изменение структуры таблицы - делаем плоскую таблицу, собираем обратно в сводную. Копирование датафрейма 14:59 Экспортируем готовые csv файлы с индексом и без 16:54 Итоги Подопытные Гуглотренды: https://trends.google.com/trends/explore?geo=DE&q=Toyota,Nissan,Subaru,Mazda,Honda&hl=en-GB Ссылка на исходные файлы: https://disk.yandex.ru/d/USKupYH5y-rUnw Ссылка на Jupyter notebook файлом: https://disk.yandex.ru/d/iOrvahnlIwLQXw Ссылка на Google Colab (незначительно отличается от ноутбука, показанного в видео): https://colab.research.google.com/drive/1UruwbF0-B_mOmLtY_7QAqOdiB5fZnemK?usp=sharing
Сегодня в меню - начальная обработка данных с помощью Python: автоматически загружаем, преобразовываем и склеиваем несколько csv файлов в одну таблицу, а так же добавляем парочку преобразований Посвящается людям, которым до сих пор приходится вручную склеивать однотипные таблицы между собой - этот несложный приём когда-то существенно улучшил жизнь мне, уверена - улучшит и вам :) В этом видео мы безжалостно эксплуатировали (в основном) Pandas ради оптовой загрузки csv файлов и их преобразования в один удобный датафрейм, а затем меняли его структуру и выгружали обратно 00:00 Интро 00:22 Получение подопытных файлов для будущего датасета с помощью GoogleTrends 03:06 Импорт библиотек и загрузка отдельного файла 04:43 Массовая загрузка файлов, проверка типа файла при загрузке 05:57 Получение данных из загруженных файлов по умолчанию 07:31 Получение данных из загруженных файлов с добавлением дополнительных параметров 10:37 Изменение структуры таблицы - делаем плоскую таблицу, собираем обратно в сводную. Копирование датафрейма 14:59 Экспортируем готовые csv файлы с индексом и без 16:54 Итоги Подопытные Гуглотренды: https://trends.google.com/trends/explore?geo=DE&q=Toyota,Nissan,Subaru,Mazda,Honda&hl=en-GB Ссылка на исходные файлы: https://disk.yandex.ru/d/USKupYH5y-rUnw Ссылка на Jupyter notebook файлом: https://disk.yandex.ru/d/iOrvahnlIwLQXw Ссылка на Google Colab (незначительно отличается от ноутбука, показанного в видео): https://colab.research.google.com/drive/1UruwbF0-B_mOmLtY_7QAqOdiB5fZnemK?usp=sharing




