Skip to main content
Spotify for Podcasters
Data Coffee

Data Coffee

By Data Coffee

Подкаст о данных в современном мире. Мнения экспертов и опыт в получении, хранении, обработке, визуализации и принятии решений на основе данных. License: CC BY-NC-ND 3.0 (https://creativecommons.org/licenses/by-nc-nd/3.0/)
Available on
Amazon Music Logo
Apple Podcasts Logo
Castbox Logo
Google Podcasts Logo
Overcast Logo
Pocket Casts Logo
RadioPublic Logo
Spotify Logo
Stitcher Logo
Currently playing episode

94 (S3E27). Уязвимость в Telegram, терминал для MacOS и CozoDB

Data CoffeeMay 20, 2023

00:00
01:00:54
94 (S3E27). Уязвимость в Telegram, терминал для MacOS и CozoDB
May 20, 202301:00:54
93 (S3E26). Elon Musk, -10x engineer, Airflow, dbt, OMD
May 13, 202301:06:11
92 (S3E25). Зачем писать свой Data Catalog

92 (S3E25). Зачем писать свой Data Catalog

Тема выпуска Зачем писать свой Data Catalog

В гостях у подкаста `Data Coffee` Иван Канашов — Data Engineer в компании Тинькофф (GitHubTelegram)


Shownotes:

0:47 Coffee

3:15 Зачем писать свой датакаталог

6:58 Модель данных каталога

9:08 Обновление данных в каталоге

17:40 Как говорить с бизнесом

21:03 Как решили идти в open source

23:37 Почему метаданные описывают не владельцы

25:20 Как понять, что каталог успешен

27:49 Lineage

29:59 Сколько времени ушло

31:49 Ролевая модель

35:13 Используется ли ML

37:23 Где посмотреть UI

40:18 Выйти и вернуться в IT

45:18 Каждый получает кайф там, где хочет

49:47 People & Data Governance

54:15 Будущее Data Governance систем

55:45 Что почитать и что поучить


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 06, 202359:28
91 (S3E24). Немного про данные и нет кофе (обычный)
Apr 29, 202301:13:05
90 (S3E23). Terrific Microsoft Excel

90 (S3E23). Terrific Microsoft Excel

Тема выпуска Terrific Microsoft Excel

В гостях у подкаста `Data Coffee` Генрих Ананьев — руководитель направления автоматизации отчётности и моделирования в Beluga Group (HabrEmail)


Shownotes:

1:15 Голосование за кофе

3:53 Какое отношение гость имеет к теме

7:35 Alex попытался пройти обучение

9:30 Почему Excel настолько популярен

11:04 Погружаемся в историю

24:40 Почему пользовательская часть популярнее

30:52 Альтернативные табличные процессоры

34:13 Преимущества перед конкурентами

55:30 Анализ данных

1:05:50 Вот Excel, сделайте теперь нормально

1:09:00 PowerPivot и другие надстройки

1:14:52 Можно ли повлиять на roadmap

1:17:45 Lambda-функции в Excel

1:21:25 Популярные проблемы

1:27:58 Игры на Excel


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Apr 22, 202301:30:25
89 (S3E22). Postman Flows, классический Twitter и галлюциногены на Майорке
Apr 15, 202350:55
88 (S3E21). AWS DataZone, YTsaurus, Postman Flows
Apr 08, 202356:48
P1-3. Кофе с психологом
Apr 04, 202301:11:18
87 (S3E20). ChatGPT на помощь учебе и работе

87 (S3E20). ChatGPT на помощь учебе и работе

Тема выпуска ChatGPT на помощь учебе и работе

В гостях у подкаста `Data Coffee` Александр Жадан — brand manager CM Games, интересующийся нейросетями (TwitterInstagram)


Shownotes:

1:41 Кофе

2:30 Выбор темы дипломной работы

5:26 Как двигался процесс подготовки текста

10:01 "ChatGPT написал диплом"?

11:53 Сколько времени ушло на запросы

15:13 Отличие результатов для разных языков

17:09 Кто знал об использовании ChatGPT

18:53 Стилизация текста

20:10 Догадался ли кто-то на защите

22:18 Выход за пределы Twitter

26:33 Злобные академики

41:39 Помогает ли ChatGPT бренд-менеджеру

45:20 Письмо остановить разработку

50:07 Решение в итоге принимать человеку

56:28 Инфляция в искусстве


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Apr 01, 202301:01:11
86 (S3E19). Shopping data, рекомендации, облака

86 (S3E19). Shopping data, рекомендации, облака

Тема выпуска Shopping data, рекомендации, облака

В гостях у подкаста `Data Coffee` Саша Айваз — Chief Data & Analytics Officer, Lamoda Tech (email, Telegram, site)


Shownotes:

0:00 Традиционный вопрос

1:50 Lamoda

11:00 Как формируется предложение и какие данные используются

16:30 Data driven decision

18:15 Какие данные собираются

21:18 Только онлайн шоппинг?

21:53 Где хранятся собранные данные

27:04 Про PowerBI

29:42 Данные по люксовой одежде и ML

41:16 Рекомендации

43:39 Качество данных

48:48 Граница облаков и observability

1:00:47 Как стать CDO


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Mar 25, 202301:12:47
85 (S3E18). ЭЭГ, коагулятор, осьминоги, Silicon Valley Bank
Mar 18, 202355:07
84 (S3E17). Беспилотники и картография
Mar 11, 202301:08:40
P1-2. Кофе с психологом
Mar 05, 202301:18:55
83 (S3E16). YouTube, Bing, EU data salaries и молитвы
Mar 04, 202358:00
82 (S3E15). DuckDB, Docker, AWS, Hashicorp, etc.
Feb 25, 202301:04:03
81 (S3E14). Данные на стройке
Feb 18, 202301:13:48
80 (S3E13). Наукометрия

80 (S3E13). Наукометрия

Тема выпуска Наукометрия

В гостях у подкаста `Data Coffee` Александр Мартиросян — Профессиональный наукометрист.


Shownotes:

0:45 Традиционный вопрос

1:38 Что такое наукометрия

3:23 Можно ли сравнивать по странам

4:22 Что мы измеряем

5:33 Значимость конференций и как померить

6:52 Какие объекты мы можем сравнивать

8:04 Как понять, чьи статьи стоит читать

9:44 Кто стоит за WoS и Scopus

12:29 Что такое impact factor

14:17 Зачем нужны цитирования

17:02 Призрак уробороса

18:18 Аналогия с социальной сетью

19:34 Хаки показателей

20:14 Молчаливо смотрим на огромный Хирш

23:29 Зависть к фабрике статей

24:32 Можно ли доверять индексу Хирша

25:20 Какой индекс Хирша у самого Хирша

25:48 Соревновательная хиршеметрия

26:18 Когда ученый становится таковым

28:14 Накрутка и борьба с ней

29:25 ОПГ Хирш

30:49 Манчкинство показателей

32:25 Денежная мотивация и соблазн

34:36 Ученые-диссиденты и альтернативные показатели

36:27 Создание новых метрик

36:55 Где взять наукометрические данные

40:51 Журналы и квартили

43:35 Data Coffee Conference

46:01 Где образуется научное знание

53:00 Как начать заниматься наукой


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Feb 11, 202301:00:01
79 (S3E12). Новости про утечки Yandex, ChatGPT, и другое
Feb 04, 202301:10:26
78 (S3E11). Путь в data engineering

78 (S3E11). Путь в data engineering

Тема выпуска Путь в data engineering

В гостях у подкаста `Data Coffee` Илья Синёв — Senior Consultant Data Engineering at adesso SE (email, LinkedIn).


Shownotes:

0:00 Внезапно про MacOS9

2:46 Гость выпуска

4:04 Отношения с кофе

7:11 Профессиональная предыстория

12:19 История развивается

13:25 Третий путь

18:50 Немного про low-code

21:38 И немного про data science

22:06 Про Adesso

23:38 Гребем на маленькой галере

25:48 Реалии второй работы в Германии

27:39 И немного databricks

33:12 low-no-code решения

38:30 Текущая ситуация и планы на будущее

39:39 Azure и AWS

42:21 Что бы сделал иначе

44:01 Перспективы и наука

47:30 И в продакшен, наукометрия

52:54 Помогает ли научный опыт

54:39 Физики и data science


Обложка - Midjourney

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jan 28, 202359:36
77 (S3E10). Сокращения, утечки, ChatGPT, Doom и кофе

77 (S3E10). Сокращения, утечки, ChatGPT, Doom и кофе

Jan 21, 202301:10:48
76 (S3E09). Кто такой Тимлид
Jan 14, 202301:12:29
P1-1. Кофе с психологом

P1-1. Кофе с психологом

Кофе с психологом


Многие хотят подслушать, о чем же говорят психологи на самом деле. И желательно так, чтобы это не было похоже на лекцию. А действительно просто беседа.

Поэтому пришла идея этого подкаста.

В первом эпизоде мы решили поговорить о мифах, связанных с психотерапией. На что обращать внимание при выборе психолога, чем в принципе занимается психотерапия и почему она стала входить в нашу жизнь.

А с вами буду я, Ирина Андрейченко психолог-психотерапевт, член Европейской и Санкт-Петербургской Организации Транзактного Анализа.

Предлагаю вам написать - о чем вам хотелось бы подслушать в следующих эпизодах?


Shownotes:

3.00 Intro

4:07 Стереотипы, такси и нарушение границ

7:28 Экономика поглаживаний

9:31 Вымогательство поглаживаний

11:39 Роль менеджера в коллективе

15:18 Зачем нужен психолог если есть друзья

17:59 Ожидания от друзей

20:58 Доверие к психотерапевту

26:23 Контракт с терапевтом

28:19 Каждый делает только для себя

37:10 Зачем мне психолог, я сам разберусь

39:07 Работа с возрастными клиентами

43:30 Вопрос цены

45:30 Если не медицина, то что

46:35 Как найти своего психолога

51:11 Как понять, что пора

53:46 Как побороть скепсис

57:07 Опять про детство

1:03:56 Завершаем


Обложка - Generated by Midjourney

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jan 09, 202301:05:08
75 (S3E08). SetApp, Skypilot, Lastpass leak, 2038
Jan 07, 202301:01:32
74 (S3E07). Итоги уходящего года

74 (S3E07). Итоги уходящего года

Ведущие подкаста "Data Coffee" подводят итоги года!


Shownotes:

0:28 Что для нас хороший кофе

04:13 Статистика подкаста

56:31 Личные итоги каждого

1:13:26 Поздравляем слушателей


Обложка - Midjourney

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat


P.S. лично от Алекса: я завел себе личный канал, где буду делиться своими мыслями обо всем и своими наблюдениями. Если вам интересен мой взгляд на мир или вы хотите больше обо мне узнать, а также, если вы готовы пуститься в споры в комментах — welcome https://t.me/alexseconds. Всем мира!🕊

Dec 31, 202201:19:08
73 (S3E06). Лазер в голову, аудио/видеопомощники

73 (S3E06). Лазер в голову, аудио/видеопомощники

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

1:24 Pub Med GPT

12:04 Tad data viewer

16:43 John Carmack vs. Meta

20:00 DOOM в лампочке

21:28 Монетизация голосовых помощников

29:48 Устройства для видеозвонков

34:46 Лазер в голову

43:10 Дизайн шоколада от Midjourney

45:31 Авторские права на AI-изображения

47:59 AI-generated music

53:28 ComposeFS for Linux

58:06 Почему ты все еще джун


Обложка - Generated by Open-AI

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 24, 202201:27:04
72 (S3E05). DOOM на елке, Midjourney, ChatGPT

72 (S3E05). DOOM на елке, Midjourney, ChatGPT

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

0:33 Поговорили немного про кофе

3:14 Как спасаться от болезни Альцгеймера

8:26 Фриланс в дата инжиниринге

17:29 Удобство Terraform и IaaC

18:52 ChatGPT

27:07 Midjourney

35:48 Профессия художник

41:25 Airflow 2.5.0

42:03 Elon Musk vs. Twitter

44:26 Еще про нейросети

47:44 Елочная игрушка с DOOM

50:11 Asahi Linux на Apple M2


Обложка - Generated by Midjourney

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 17, 202256:00
71 (S3E04). Minimal modeling

71 (S3E04). Minimal modeling

Тема выпуска Minimal Modeling

В гостях у подкаста `Data Coffee` Алексей Махоткин — автор концепции Minimal Modeling (сайт, рассылка, видео1, видео2).


Shownotes:

0:38 Я постоянно его пью

2:14 Что это такое

3:51 Как это соотносится с 3NF

5:18 Как выглядит модель

7:36 Как заполнять описание

10:39 Кто это будет заполнять

17:13 Минимальная модель Twitter

20:07 Что делать с моделью

22:44 Зачем SQL в модели

24:07 Почему не работает Anchor

26:39 А если уже есть Data Catalog

34:24 В какой момент это нужно

44:43 Как объединить разные БД

49:16 Как жить с этим в большой компании

51:58 Устойчивость к изменениям

1:00:06 Практика применения


Обложка - OpenAI Dall-E, promt="Minimal Modeling"

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 10, 202201:03:21
70 (S3E03). Конспирология, nlp2sql, SQL for CSV

70 (S3E03). Конспирология, nlp2sql, SQL for CSV

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

2:52 Разделение одной неназванной компании

5:52 Дальнейшее разделение

7:39 Почерневшая ягода

11:43 Что-то нас много стало

13:09 Конспирология теперь и в нашем подкасте

17:51 Diagram as a Code

20:20 Excel BigData

23:37 SQL for CSV

25:58 nlp2sql

30:39 DockerHub и безопасность

35:59 Игры на выживание

38:54 И вновь doom

42:54 Stable Diffusion 2.0

44:56 Нововведения в whatsapp и ICQ

50:10 GPT3 в google sheets


Обложка - Generated by DALL-E 2, prompt "Aliens and exploding watermelon in a desert"

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 03, 202251:50
69 (S3E02). Метрики и аналитика сна
Nov 26, 202201:04:05
68 (S3E1). Любим Airflow, ругаем Apple, задаем вопрос слушателям

68 (S3E1). Любим Airflow, ругаем Apple, задаем вопрос слушателям

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

4:28 Увольнения и природные катаклизмы

6:56 Твиттер

11:52 Твиттер и телеграм, подписки

17:19 Пресловутая связь роста и зарплаты

19:36 Estante suave

20:25 Радикальное изменение в подкасте

20:46 Massive layoffs

21:34 Последнее обновление macos

26:06 Классически про Airflow

30:27 Немного про ubuntu 22.10

34:42 Потеряли дата-инженеров в подкасте

35:30 Doom на Airflow

38:30 Про дельфинчика

40:59 Natural language to SQL query

45:11 AWS Code Whisperer

48:07 Shutterstock и DALL-E

51:28 Вопрос к слушателям по поводу S3

53:16 Asahi Linux на M1


Обложка - Generated by DALL-E 2, prompt "airflow, painting by Matisse"

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Nov 19, 202256:13
67 (S2E25). Организация data-конференций

67 (S2E25). Организация data-конференций

Sep 24, 202201:04:48
66 (S2E24). iOS, Airflow, Doom, and biomedicine
Sep 17, 202201:04:38
65 (S2E23). Data catalogs

65 (S2E23). Data catalogs

Тема выпуска Data Catalogs

В гостях у подкаста `Data Coffee` Data Engineer из компании Picsart — Алмаз Мурзабеков (Telegram, Email)


Shownotes:

0:56 Чашку-другую, но не сбивая биоритмы

1:45 Кто такой DI engineer

6:52 Что такое data catalog

11:20 Meta-информация

17:21 Как заполняется data catalog

20:32 Amundsen, OpenMetaData

26:15 Atlan

31:39 Структура бизнес-глоссария

33:06 Как продать data catalog руководству

36:21 Чем заниматься DE после внедрения

39:58 Витрины как сервис

41:03 Algorithm-based decision making

42:48 Критерии выбора data-каталога

46:15 DQ и интеграция с мессенжерами

48:58 Data catalog on top of file system

51:44 Data exploration

54:11 Сколько проект займет в людях

57:02 Как сделать MVP


Обложка - Michael Holley Swtpc6800, Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Sep 10, 202201:02:15
64 (S2E22). Прослушка, file system SQL, psycopg и другое

64 (S2E22). Прослушка, file system SQL, psycopg и другое

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

1:40 ДР в подкасте

3:12 Stream deck

7:13 Дум на тракторе

8:22 Подслушивание через оптоволоконный кабель

13:21 SQL для файловой системы

16:29 Новость от слушателя

18:55 Тема от слушателя, галера или in-house

33:09 Дальний космос в колбасе

35:10 TikTok, дипфейки и брюзжание

37:57 20 лет Shazam

40:25 Про яндекс, поиск и обмен сервисами

44:59 Diablo 1 в браузере

46:02 Немного про GeForce Now

48:45 MacPass

50:15 DbGate

51:59 Heroku убирает бесплатные тарифы

52:55 Когда забанили в гугле


Обложка - Joaquim de Mello (book author), Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Sep 03, 202256:03
63 (S2E21). Data Management Platform

63 (S2E21). Data Management Platform

Тема выпуска Data Management Platform

В гостях у подкаста `Data Coffee` руководитель команды продукта Data Management Platform в Яндекс GO — Максим Пчелин (LinkedIn, Telegram)


Shownotes:

00:42 Кофе: важно не какой, а где

02:15 На пути к данным

06:07 Любимая роль на проектах

07:30 Кто такой data platform product owner

09:45 Плохо пахнущие субстанции в консалтинге

14:28 Какая из работ была лучше

16:24 Легко ли даются трансформации из роли в роль

20:52 Синдром самозванца - хороший признак

25:13 Планнинг дел в Telegram

29:20 Как не страдать от невыполненных дел

33:04 Разница между DWH и data platform

39:55 Как общаться с админами

43:25 Как разбираться в людях

47:30 Что действительно нужно аналитикам

52:22 Как делать DWH гибким

55:06 Где искать людей на работу

59:28 Сколько будет 2 в 10й степени


Обложка - Adam37, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Aug 27, 202201:02:10
62 (S2E20). VR, змеиный экзоскелет и новинки медицины
Aug 20, 202256:36
61 (S2E19). Reverse ETL, проблемы в cloud и расточительство пакетных менеджеров
Aug 13, 202201:03:21
60 (S2E18). dbt — data transformation workflow

60 (S2E18). dbt — data transformation workflow

Тема выпуска dbt

В гостях у подкаста `Data Coffee` Lead Data Engineer в компании NabuMinds — Никита Баканчев (LinkedIn, Telegram)


Shownotes:

0:48 Кофе 

1:32 Что такое dbt

2:56 Истинная сущность dbt

4:56 Что нужно сделать, чтобы он взлетел

10:06 Как это всё запустить

13:27 Где подводные камни

14:48 Миграция

17:00 Отличие core от cloud

19:53 Как понять, что пора

22:53 Степень зрелости проекта

25:24 Изменения в моделях

28:05 Отладка макросов

29:31 dbt test

31:25 lineage и dbt docs

35:19 Работа с разными DB

36:28 data quality и dbt

42:23 dbt community

44:42 Полезные dbt-пакеты

53:29 Легко ли слезть с dbt


Обложка - dbt

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Aug 06, 202258:32
59 (S2E17). Пауки, нейроинтерфейсы, восстание машин и немного IT
Jul 30, 202201:02:04
58 (S2E16). Приоритеты, финансы, роботы, нейросети и данные
Jul 23, 202238:05
57 (S2E15). Музыка, прогнозы, саранча, и немного про дирижабли
Jul 16, 202201:10:07
56 (S2E14). Edge ML

56 (S2E14). Edge ML

Тема выпуска Edge ML

В гостях у подкаста `Data Coffee` Data Scientist в компании Dannie — Елена Шевченко


Shownotes:

00:52 Классический вопрос

02:13 Начало карьеры

04:03 Чем плох R

05:40 Дебаты R vs Python

07:01 Непростой путь в DS

07:45 Что такое Edge ML

10:05 Потенциальная потеря полезной информации

10:17 Соотношение точность-полнота

12:58 Когда разумно использовать edge устройства

16:31 Майнинг на edge устройствах

17:12 Дообучение моделей после кражи устройства

18:13 Почему эта сфера и не крупная компания

21:03 Небольшие проекты и беспилотники

22:10 Стоимость edge устройств

23:59 Процесс разработки под edge устройства

28:35 Как обычному DS пощупать edge ml

29:44 Про квантование

34:59 Ассоциация с обучением с подкреплением

36:23 Языки имплементации

38:16 Android и edge ml

40:01 Работа с большими моделями

42:50 Есть ли работа для data engineer

43:57 Внезапный podcast inversion of control

44:11 IoC: Бигада в датакофе

44:52 IoC: Глубокие нейронные сети

45:54 Как попасть в эту сферу 47:12 NLP на устройствах

48:38 Немного про voice recognition

49:25 edge ml своими руками

49:55 IoC: искуственный интеллект

51:05 Как модель положить в железку и дообучение

52:49 Контроль качества

55:40 Создание обучающей выборки

56:17 Embedded разработчики

57:17 Дорогие дата-сатанисты

58:00 Как проверить DS

59:38 Менеджер-дата-сатанист

1:01:10 DL как black box

1:01:45 Вопрос от друга

1:03:47 Первый шаг в DS

1:05:31 Проходим собеседование вместе

1:08:08 Накидываем на лингвистику


Обложка - Jing.fm, CC BY-SA 4.0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jul 09, 202201:09:43
55 (S2E13). IE retirement, Telegram Premium, Excel, datadiff
Jul 02, 202201:02:25
54 (S2E12). Беседа про собеседования

54 (S2E12). Беседа про собеседования

Тема выпуска "Беседа про собеседования"!


Обложка - Freepik, CC BY-SA 3.0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jun 25, 202201:12:33
53 (S2E11). WWDC22, Natasha, Bergamot & AI has come to life
Jun 18, 202201:07:47
52 (S2E10). Игры на работе

52 (S2E10). Игры на работе

Тема выпуска Игры на работе

В гостях у подкаста `Data Coffee` game designer из Kama Games — Коля Юн


Shownotes:

1:55 Кофе

3:20 Как гость шёл в геймдизайн

11:39 Как попасть в геймдизайн

14:15 Первый месяц на новой работе нужно играть

15:52 Feature review

19:00 Неудачная фича

21:35 Что нужно знать геймдизайнеру

23:20 Нужно ли художественное образование

25:00 Какие дизайнеры есть на игровом проекте

29:10 Можно ли из аналитика попасть в геймдиз

32:01 product_manager == game_designer

34:20 Куда может вырасти геймдизайнер

36:30 Тайное желание гостя

38:50 Требуемые skills геймдизайнера

43:50 На кого все геймдизайнеры пытаются равняться

46:25 Три любимые компании

48:10 Кодзима — гений?

50:00 За какой платформой будущее


Обложка - National Gallery of Art, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jun 11, 202256:44
51 (S2E9). KDE Connect, хранение секретов и нанороботы
Jun 04, 202201:05:36
50 (S2E8). Кофейный-юбилейный

50 (S2E8). Кофейный-юбилейный

Тема выпуска Кофейный-юбилейный

В гостях у подкаста `Data Coffee` PM в DWH в Yandex.Go, автор канала Coffeeinmsk — Анастасия Королёва (Telegram, LinkedIn)


Shownotes:

01:47 Обязательный гостевой вопрос

03:35 Как научиться заваривать кофе в турке

06:04 Турка из серебра — стоит того?

08:19 Откуда все эти знания о кофе

10:57 Какую кофеварку покупать домой

14:36 Как погрузиться в мир кофе

17:40 Как искать кофе в новом месте?

24:17 Что такое кофе specialty?

27:38 Кофейный снобизм

29:45 Существует ли достойный растворимый кофе

31:47 Правильное начало кофейного пути

39:00 Когда лучше молоть зёрна

43:20 Альтернативное молоко

48:35 Кофе без кофеина

50:52 Как выбрать кофе для джезвы

54:14 Биодинамика

55:09 Coldbrew


Обложка - gnokii at openclipart.org, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 28, 202201:02:10
49 (S2E7). VR-шлем с отдачей, регуляция ML-сервисов и наноботы
May 21, 202201:12:43
48 (S2E6). Cooking stages, pizza scientists и индейка в мандаринах

48 (S2E6). Cooking stages, pizza scientists и индейка в мандаринах

Тема выпуска Cooking stages, pizza scientists и индейка в мандаринах

В гостях у подкаста `Data Coffee` Data Engineering TechLead в Dodo Engineering, член программного комитета SmartData, DE or DIE data engineering digest редактор и организатор митапов DE or DIE — Ксения Томак (LinkedIn, Twitter, DE or DIE)


Shownotes:

1:06 Кофейный вопрос

1:51 Чем занимается TechLead

5:10 Какие данные собираются про пиццу

10:32 Поиск маршрутов

12:10 Эксперименты с рецептами и RnD

18:26 Прогноз закупки ингредиентов

19:36 Что нужно уметь, чтобы попасть в Pizza RnD

20:49 Рекомендационная модель

24:50 Контроль качества продуктов по фото

28:40 DoDo BI

32:30 "Умная" пиццерия

33:29 Переход PowerBI-Superset

36:24 Франчайзинговый "каннибализм"

37:46 Никакой пиццы после полуночи

39:37 Переход на data-driven подход

43:52 Доставка пиццы дронами

48:35 DEorDIE community

56:58 Поиск участников и докладов

1:00:44 Работа для борьбы с синдромом самозванца


Обложка - public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 14, 202201:03:29
47 (S2E5). Курсы для новичков, менторы и community

47 (S2E5). Курсы для новичков, менторы и community

Тема выпуска Курсы для новичков, менторы и community

В гостях у подкаста `Data Coffee` junior data engineer, автор канала Girl DataEng и создатель чата для начинающих дата инженеров DataYoungers — Анна Строевская (Telegram)


Shownotes:

01:04 Кофе — это вид снотворного

01:42 Вопрос, который беспокоит всех

04:07 Вопрос, который беспокоит Дину

07:43 Скиллы, которые помогли

08:53 Что мешает новичку в профессии

12:39 Как гостья готовилась к DE

15:14 Противоречивые курсы

16:56 DE и аналитик: разные взгляды на задачи

19:07 Переход в DE: составляющие успеха

23:07 Почему не аналитика или ML

26:27 Что зажигает в работе DE

28:50 Никто не умеет писать код

32:49 Куда хотелось бы расти

34:48 Как подступиться к проблеме с задачей

39:03 Community для новичков

43:59 Приглашают ли джуна на обсуждения

45:42 Синдром самозванца у новичков

48:26 Кому задать вопросы первого дня


Обложка - Ryan Riggins ryan_riggins, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 07, 202255:23
46 (S2E4). Дирижабли, кнопка Mute, Twitter Илона Маска, etc.
Apr 30, 202201:00:01
45 (S2E3). xLookUp, Dataminer, RegExp for Email, Doom w/raytracing
Apr 23, 202201:06:15
44 (S2E2). Метеорология, ледники и голодные медведи

44 (S2E2). Метеорология, ледники и голодные медведи

Тема выпуска Метеорология, ледники и голодные медведи

В гостях у подкаста `Data Coffee` метеоролог, младший научный сотрудник Арктического и Антарктического научно-исследовательского института — Ульяна Прохорова (Instagram)


Shownotes:

2:05 30 лет и переосмысление кофе

3:05 Метеорология, океанология и экспедиции

6:42 Голодные белые медведи

8:58 Первая экспедиция

11:29 Граница между метеорологией и океанологией

12:03 Данные в метеорологии

18:19 Тепловой баланс ледника

21:32 Верификация данных

23:33 Что мы будем с этого иметь?

27:22 Мировые центры данных

28:17 Реанализ

32:40 Хаос в форматах данных

34:10 Квадрат или шестиугольник?

35:12 "Через две минуты дождь кончится"

36:52 Метео-краудсорсинг

40:50 Доступ к собранным данным

42:35 Как ещё можно помочь науке

44:00 Климатические параметры

49:07 Статьи про ледники

50:00 Как происходит процесс сбора данных

54:44 Как располагается сеть наблюдений

56:04 Допустим, я инженер данных

1:05:07 Заруб с p-value

1:06:49 Куда идти учиться


Обложка - Author, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Apr 16, 202201:10:14
43 (S2E1). Twitter, DALL-E, Ubuntu 22.04, PyTorch, а также психоделики

43 (S2E1). Twitter, DALL-E, Ubuntu 22.04, PyTorch, а также психоделики

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


1:08 Последний кофе Алекса

2:16 Диаграммы в github markdown

8:49 Про личную базу знаний и Obsidian

13:05 Новости про твиттер

16:31 Наивные размышления про рынки ценных бумаг

22:18 Быстрая имплементация pytorch для M1

25:11 Инстанцы на M1 в AWS и немного любимого Airflow

29:00 DALL-E 2

33:53 Don't look up great again

39:00 Ubuntu 22

46:28 dockerized

50:41 Психоделики и нейроинтерфейсы


Обложка - cogdogblog, CC BY 2.0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Apr 09, 202259:23
42. Как жить?
Mar 05, 202201:10:33
40. Игровая аналитика как она есть

40. Игровая аналитика как она есть

Тема выпуска Игровая аналитика как она есть

В гостях у подкаста `Data Coffee` руководитель направления аналитики в My.Games — Олег Потапов (Facebook)


00:58 Традиционно про кофе

01:56 Зачем в играх нужна аналитика

04:32 Нужен ли аналитик до того, как игра стала хорошей

08:12 Как выбрать хорошего аналитика

11:36 Конкретные скиллы в аналитике

16:55 Аналитические метрики

24:12 Как можно донести свое видение до проекта

27:44 Верят ли разработчики решениям от аналитики

29:10 Метрики, направленные на отдельных пользователей

31:12 Успешность проекта и Factorio

36:31 Как проводятся АБ тесты

43:04 Исследования на разных типах игроков

45:32 Процент играющих людей по отношению к проекту

47:44 Метрики, чтобы понять, что дело не стоит свеч

50:38 Стоит ли пилить фермы ради денег

53:01 Любимый проект гостя

55:57 Когда стоит принять то самое грустное решение


Обложка - Metropolitan Museum of Art, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Feb 19, 202201:02:37
39. Маркировка рабочих, философия, и базы данных

39. Маркировка рабочих, философия, и базы данных

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

02:37 Auchenberg/volkswagen определяет, что тесты зап...
05:37 История с распределенной базой на sqlite развив...
10:27 10 лет AWS DynamoDB - NoSQL база данных single-...
13:52 Отличия в парсерах PNG у Apple и остальных
20:31 Майнинг в Иркутске
23:23 EdgeDB 1.0 release - first open source graph-re...
27:41 Стартап Engineer.ai, позиционирующий себя как р...
33:34 Описываем свой SQL на естественном языке и выпо...
37:01 Закрывают IBM Watson Health по кускам и продают...
37:18 Интересная штука, может попробую: естественный...
40:40 После анализа бигдаты было принято решение увол...
42:18 Рабочих мясокомбината в Набережных Челнах «пром...
53:57 Живая нейросеть общего назначения
56:10 Дрон гоняет голубей в Швейцарии смотреть до кон...
01:01:21 Атаки на NLP-системы: невидимые пробелы, подмен...
01:09:33 Айтишник не может зарабатывать меньше 4000$, он...


Обложка - Smallbones, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Feb 12, 202201:09:02
38. Snowflake Data Cloud

38. Snowflake Data Cloud

Тема выпуска Snowflake Data Cloud

В гостях у подкаста `Data Coffee` автор канала Сингулярности не будет, фаундер holistic.dev, dwh.dev и parsers.dev, заводила в snowflake чатах (ru, en) и канале со snowflake новостями — Антон Ревяко


Shownotes:

02:04 Две нижегородские кофейни

06:18 Что за мифический зверь Snowflake

10:48 Обновления в облачных базах

15:20 Статические анализаторы кода

19:16 Что под капотом у Snowflake

20:45 Можно ли запустить в private-облаке

26:19 Data Marketplace

30:20 Выгодные преимущества Snowflake

34:26 Специфические (не)удобства

52:51 Поддержка ML

57:32 Кому Snowflake точно не подойдёт

58:54 Проекты гостя


Обложка - Gagea, Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Feb 05, 202201:15:22
37. Open source, котики, мемы и новости

37. Open source, котики, мемы и новости

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

00:40 Мак и мак (долгий блок)

18:33 Коротко про faker

19:53 Проблемы онлайн-курсов

21:44 Дыры в open source (получение рута)

22:50 Нововведения в superset

28:49 Пилить ли свой ETL

31:28 Обилие курсов для новичков

35:13 Про крипту и центробанк

37:51 Искусственный зрительный аппарат

41:01 Мечты о second brain

43:41 Раздача интернета с дирижаблей

46:30 Starlink и котики

48:21 Мемы по мотивам log4j

49:01 Распознавание голосов птиц

50:01 Стандарт многоквартирного умного дома

55:06 AirTag и слежка

57:31 Удерживающие собеседования

01:02:12 Заканчиваем историей про именование серверов


Обложка - Auckland Museum, CC BY 4.0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jan 29, 202201:10:07
36. Тестирование программного обеспечения (гостевой)

36. Тестирование программного обеспечения (гостевой)

Тема выпуска Тестирование программного обеспечения

В гостях у подкаста `Data Coffee` QA Lead в JetBrains, ведущая подкаста "Вроде в проде", ментор и консультант на тему автоматизации и тестирования - Саша Пшеборовская (Twitter, Instagram, LinkedIn, Подкаст, GetMentor)


Shownotes:

02:42 Традиционный вопрос про кофе

04:44 Что такое тестирование

11:14 Можно ли обойтись без тестирования

14:43 Автоматизированное или ручное

20:52 Противостояние тестировщиков и разработчиков

26:40 Почему разработчики сами не тестируют

27:32 Методологии тестирования

31:28 Обилие курсов для новичков

33:37 Войти в ИТ через тестирование

38:09 Популярные фреймворки для тестирования

40:47 Методы тестирования в data-продуктах

46:12 Data quality и тестирование

53:00 Как устроена работа в команде

56:34 Формальная верификация и связь


Обложка - Blobbie244, CC BY-SA 3.0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jan 22, 202201:02:36
35. Первый iPhone, немного бигдаты и много электричества

35. Первый iPhone, немного бигдаты и много электричества

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

01:02 15 лет назад был анонсирован первый iPhone
12:18 Смартфон запитал бумажный синтезатор по NFC
18:56 🔗 Ford представил технологию зарядки электромоб...
33:39 Устройство определяющее наличие вредоносного П...
40:01 В Японии заработают автобусы-поезда
44:25 Hyundai показала тележку-робота MobED. Она осна...
48:26 Customizable ноут я этой штуки не видел может...
54:39 Маленький кабинет для себя на 9м^2 во дворе сб...
57:45 Отличное завершение года считаю. В сеть выложи...
1:01:48 В августе в соцсетях разошлось письмо основател...
1:12:56 Polars – быстрая библиотека подготовки данных к...


Пара дополнительных ссылок, упомянутых в шоу:

https://flipperzero.one/

https://www.kiteboard.io/


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jan 15, 202201:14:43
34. Первым делом самолёты (гостевой)

34. Первым делом самолёты (гостевой)

Тема выпуска Первым делом самолёты (и их данные)

В гостях у подкаста `Data Coffee` технический директор S7 ТехЛаб, инновационного подразделения S7 - Андрей Жуков (Telegram, Facebook)


Shownotes:

01:35 Coffee
03:17 Что за инновации творятся в S7
13:46 Как шла цифровизация
21:24 Данные, получаемые с самолетов
31:33 Платформа данных
39:06 Управление хаосом
43:07 DS и ML по данным с самолетов
46:19 Команда
53:25 Инструменты обработки данных
01:02:10 Вклад в open source


Обложка - PolyLingua, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jan 08, 202201:03:59
33. Подводим итоги года
Dec 31, 202101:42:57
32. Personal Knowledge Management (гостевой)

32. Personal Knowledge Management (гостевой)

Тема выпуска Personal Knowledge Management

В гостях у подкаста `Data Coffee` Machine Learning Engineer at ExB Labs - Сергей Гамоцкий (Сайт, Telegram, LinkedIn)


Shownotes:

00:23 Coffee

03:23 Personal Knowledge Management System: что такое...

07:42 Какая информация критична для потери

08:41 Что гость хранит в PKMS

10:44 Как искать то, что давно сохранено и забыто

17:31 Категории, tags и другие атрибуты

21:19 Какой системой пользуется гость

27:21 Насколько просто переносить базу в другие инстр...

30:49 Как заставлять себя вносить информацию в базу

35:53 Так ли много типов информации, чтобы заводить PKMS

40:34 Как правильно записывать информацию

43:20 Поиск по базе знаний

48:01 Философия персональной базы данных

50:06 Zettelkasten

53:17 Johnnydecimal

55:57 Digital garden

01:02:06 Насколько важно, чтобы инструмент был быстрым,...


Обложка - Duke Innovation Co-Lab, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 25, 202101:06:45
31. Выйти из IT и зайти нормально, AWS, Pandas, супер-кабель

31. Выйти из IT и зайти нормально, AWS, Pandas, супер-кабель

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

02:56 Не уйти ли из айти

19:10 Маркетолог-IT-священник. Как вам такой путь?

23:34 Техника определения скрытых камер при помощи To...

31:09 Катастрофическая уязвимость в Apache log4j

32:12 AWS лежал больше 4х часов

35:07 Злоумышленники и AirTag

39:09 Путь Мака от кровати до хоумофиса теперь застра...

42:17 Зарядный кабель, который в свернутом состоянии...

47:26 3dfx никогда не выпускала Voodoo 5 6000 с четыр...

49:10 Удобный инструмент для изучения Pandas

49:12 3dfx никогда не выпускала Voodoo 5 6000 с четыр...

51:04 23 декабря 2021 года завершение разработки Pyth...

52:27 Как прогуливать встречи в Zoom с помощью Python

59:19 Rqlite - распределенная реляционная БД на основ...

1:01:31 В Оксфорде испытали нейросеть с 530 млрд параме...

1:09:13 Кофе подорожает

1:10:37 Второй апдейт для ремастера quake 1


Обложка - Public Domain

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 18, 202101:13:11
30. Аспирантура в области QnA-систем (гостевой)

30. Аспирантура в области QnA-систем (гостевой)

Тема выпуска Аспирантура в области QnA-систем

В гостях у подкаста `Data Coffee` Аспирант Университета ИТМО - Павел Ефимов (Google Scholar)

14 декабря 2021 года пройдет бесплатная онлайн-конференция DataStart по Data Science, машинному обучению и нейросетям. Узнайте о самых последних решениях в мире Data Science! Трансляция будет абсолютно бесплатной, но если вы хотите купить видеозаписи, то специально для наших слушателей есть промокод: сoffee500


Shownotes:

01:59 Отношение к кофе

02:49 Работа в университете

03:29 Какие языки считаются слаборесурсными

07:03 Что такое вопросно-ответный поиск

10:43 Фактологические вопросы

12:04 Поиск ответа в тексте

15:06 Архитектура QnA системы

16:19 Что такое ридер и как оценивать качество QnA

18:35 Можно ли обойтись без ML

22:36 Языковые модели

23:57 Word embeddings

27:55 Король - мужчина + женщина = ?

32:26 Какие модели используются сейчас для NLP

32:50 Трансформеры

36:22 Берт и другие жители Улицы Сезам

39:06 Лимиты в QnA-системах

41:04 Особенности национальной аспирантуры

43:31 Можно ли использовать в своих целях результаты исследований

45:17 Что есть интересного и перспективного в NLP

51:00 Векторный поиск "по-старинке" и современный

54:32 Самостоятельное обучение новичка в QnA

56:18 Какие языки программирования используются


Обложка - Therain, Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 11, 202101:00:18
29. Oxxxymiron, нейросети, единые стандарты и монополисты

29. Oxxxymiron, нейросети, единые стандарты и монополисты

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!

14 декабря 2021 года пройдет бесплатная онлайн-конференция DataStart по Data Science, машинному обучению и нейросетям. Узнайте о самых последних решениях в мире Data Science! Трансляция будет абсолютно бесплатной, но если вы хотите купить видеозаписи, то специально для наших слушателей есть промокод: сoffee500


Shownotes:

02:08 Изучение эволюции человеческих концепций с помощью зондирования

08:06 NVIDIA GauGAN2 создаёт фотореалистичные изображения

12:08 "Визуальная" база данных в PNG

14:33 Избыток медиаконтента сегодня и Oxxxymiron

21:42 WinAMP собираются оживить

23:35 Единый стандарт для "умного" дома

26:11 USB-C как единый стандарт для зарядки

32:38 Опровержение про MuzeNet

34:37 Платное беспилотное такси

35:53 Дуров давит на сторонние Telegram-клиенты

38:44 VR-перчатка от Meta

40:07 Новости от AWS

42:04 Завершение поддержки Firefox Lockwise

50:10 JetBrains DataSpell и Gateway

53:05 Оптимизация NumPy в десятки раз


Обложка - Metropolitan Museum of Art, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 04, 202159:53
28. Анонимность при поиске работы, IT-курсы и другое (гостевой)

28. Анонимность при поиске работы, IT-курсы и другое (гостевой)

Тема выпуска Анонимность при поиске работы, IT-курсы и другое

В гостях у подкаста `Data Coffee` Founder & CEO Get me IT - Дима Доброхотов (Facebook, Хабр)

14 декабря 2021 года пройдет бесплатная онлайн-конференция DataStart по Data Science, машинному обучению и нейросетям. Узнайте о самых последних решениях в мире Data Science! Трансляция будет абсолютно бесплатной, но если вы хотите купить видеозаписи, то специально для наших слушателей есть промокод: сoffee500


Shownotes:

01:47 Усыпляющий кофе

03:34 Переводы, туризм, продажи, HR и IT

05:34 Зачем нужна анонимность при поиске работы

11:25 Реально ли быть анонимным в сети

16:43 Что плохого, если вас постоянно одолевают рекрутеры

19:22 Как сложно рекрутерам в Европе

23:30 Зачем компаниям анонимные соискатели

27:49 Инструменты для сбора данных о кандидатах

32:24 Анализ качества кода соискателей в GitHub

39:50 IT-курсы и трудоустройство после них

45:43 Нужен ли технический background для IT

48:56 Считает ли гость свой переход в IT успешным

57:27 Лопата и яблоки, или самостоятельное обучение


Обложка - Jorjum, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Nov 27, 202101:07:23
27. Кнопка Turbo, таблицы, "отжим" и метавселенные

27. Кнопка Turbo, таблицы, "отжим" и метавселенные

Nov 20, 202101:03:10
26. Орнитология и birdwatching (гостевой)

26. Орнитология и birdwatching (гостевой)

Тема выпуска Орнитология и birdwatching


В гостях у подкаста `Data Coffee` профессиональный орнитолог и бёрдвотчинг гид, преподаватель Биологического факультета МГУ, лектор в проектах Московского зоопарка и Политеха, автор проекта о птицах и природе Lyric Forester - Григорий Евтух (Telegram, Instagram, Facebook, VK)


Shownotes:

00:38 Bird-friendly coffee

04:33 Традиционный вопрос

05:31 Что изучают орнитологи

09:14 Теория или полевые исследования

11:01 Почему именно орнитология?

12:23 Зачем метить птиц и как собирать данные

16:03 Можно ли самому понять, какую информацию несет метка на птице

19:36 Помогает ли исследованиям информация о найденных меченых птицах?

21:48 Существует ли база знаний о миграции птиц?

23:46 Более современные способы сбора информации о птицах

28:32 История с большими счетами за роуминг

31:03 Crowd funding исследовательских проектов

34:08 Что происходит с собранными данными

36:09 Выводы и решения на основе данных

39:53 Распознавание птиц по звуку и фото

44:12 И снова про crowd sourcing

47:38 Открытые научные вопросы в орнитологии

55:22 Что нужно делать, чтобы стать орнитологом

57:56 Самая любимая птица


Обложка - U.S. Fish and Wildlife Service, Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Nov 13, 202101:02:22
25. Нейросети, майнинг, TouchBar и выбор компьютера

25. Нейросети, майнинг, TouchBar и выбор компьютера

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

02:27 Сбой в магазине Ozon

06:34 Redis 3 не поддерживает Arm64

07:34 Удобства TouchBar

08:50 При этом TouchBar нужен не всем

10:49 Проблемы у Facebook и размышления про Meta

17:55 MacOS Monterey и Apple Fitness+

27:00 Какой компьютер покупать Mak’у

31:02 Генерация картинок по русскому тексту в нейросети от Сбера

36:12 Нейросеть от Сбера, но в области медицины

42:50 И ещё одна нейросеть, но уже от Facebook, работающая на звуковых волнах

49:33 Сбор данных с камер, установленных в торговых центрах Москвы

51:06 Трекинг активности работников в Китае

52:10 Продолжение истории с XSolla

54:39 Ограничение работы систем распознавания лиц и сбора данных в Европе и Австралии

1:01:06 Майнинг криптовалют на попутном газе при добыче нефти

1:04:00 Эмбеддинги логотипов метал-групп


Обложка - сгенерирована нейросетью ruDALL-E

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Nov 06, 202101:05:50
24. Что скрывает в себе Маруся? (гостевой)

24. Что скрывает в себе Маруся? (гостевой)

Тема выпуска Что скрывает в себе Маруся?


В гостях у подкаста `Data Coffee` руководитель разработки backend голосового помощника "Маруся" - Вадим Пуштаев (Facebook)


Shownotes:

02:43 Кофе можно пить любой

04:07 Как нас подслушивает Маруся

08:20 Маруся и Беларусь

10:09 Определение владельца локально

11:15 Можно ли поменять Марусе имя

13:22 Анализ детских голосов

16:40 Кто размечает данные

17:50 Что если у взрослого детский голос

19:39 Как устроена цепочка обработки запроса

24:30 Выбор подходящего навыка для ответа

26:54 Оценка качества работы

28:28 Использование пользовательских запросов в улучшении сервиса

29:47 Самые интересные навыки

32:32 Разработка сторонних навыков для Маруси

37:24 Какая статистика собирается

39:54 Кодекс этики ИИ

45:19 Влияние исходных данных на результаты

47:58 “Занавески” и “штора”: умный дом

52:29 Могут ли поспорить две Маруси

54:44 Журнал запросов и доступ к внешним сервисам

1:02:06 Регистрация внешних skills

1:05:08 Голосовые помощники вне дома-офиса


Обложка - Orion 8, Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Oct 30, 202101:09:31
23 (bonus). Куда развиваться?
Oct 24, 202127:48
22. Airflow, Snowflake, пиво и зарплаты DE
Oct 23, 202101:10:12
21. Найм в ИТ и семь "смертных грехов" вашего резюме (гостевой)

21. Найм в ИТ и семь "смертных грехов" вашего резюме (гостевой)

Тема выпуска Найм в ИТ и семь "смертных грехов" вашего резюме

В гостях у подкаста `Data Coffee` T&D Project manager at Intella - Анастасия Пилькевич (LinkedIn, Facebook)


Shownotes:

02:38 Что такое t&d?

03:17 Отношение к кофе

04:12 Что происходит с наймом в it сегодня

06:30 Влияние пандемии на рынок найми

10:07 Найм в условиях дефицита кадров

18:03 Cтранные места для хантинга

19:15 Самые странные требования к кандидатам

21:12 Как создается профиль будущего кандидата

23:11 Как тестируются soft-skills и пост-оплата

25:17 7 смертных грехов в резюме

28:13 Переход из it в it-рекрутеры

29:26 Определение зарплаты для новой вакансии на основе данных о рынке

31:21 На сколько поднялись зарплатные ожидания в последние 1-2 года

34:20 Торги на собеседовании

36:52 Чаще ли стали торговаться?

37:43 Удалённая работа (плюсы и минусы)

41:23 Что делать, когда на рынке 20% выгоревших людей

44:59 Как добиваться повышения зарплаты

52:36 Необычные переходы между профессиями

53:42 Насколько этично предлагать вакансию по diversity квоте

55:28 Cultural fit (с обеих сторон)

1:03:58 Как заранее понять, что кандидат с опытом собеседований, но без технического опыта

1:10:49 Влияет ли уровень образования на зарплату кандидата

1:12:24 Вакансия в my games, data engineer

1:12:54 Как слабой команде нанять сильного инженера

1:18:17 Послешоу, про вторжение в личную жизнь


Обложка - The Seven Deadly Sins and the Four Last Things, Public domain

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Oct 16, 202101:19:49
20. Python, PgSQL и Vulkan (но не ставки на спорт)

20. Python, PgSQL и Vulkan (но не ставки на спорт)

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!

Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc


Shownotes:

01:33 Python 3.10

08:02 JupyterLab standalone application

12:22 PostgreSQL 14

13:30 Apache Kafka 3.0.0

14:31 SemVer

17:23 askgit

24:05 Windows 11 про которую никто не может ничего сказать

27:37 Игры и Vulkan (но не ставки на спорт)

29:40 Как нас коснулось падение сервисов Facebook

35:25 Идентификация лицом и жертва киберпреступления среди ведущих

41:08 Apple купил сервис классической музыки Primephonic

48:35 Программист 2 года назад начал работать в виртуальной реальности

1:00:46 Есть ли у собак СДВГ

1:04:56 Новая рубрика подкаста: Off Topic


Обложка - Freshmaniac, Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Oct 09, 202101:17:51
19. Кофейный бизнес, SQL, dbt и BI (гостевой)

19. Кофейный бизнес, SQL, dbt и BI (гостевой)

Тема выпуска "Кофейный бизнес, SQL, dbt и BI"

В гостях у подкаста `Data Coffee` кандидат экономических наук, специалист и руководитель в области BI, руководитель компании Valiotti Analytics — Николай Валиотти (Сайт, Telegram)

Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc


Shownotes:

00:35 Знаменательный день для подкаста

03:03 Всё будет кофе, даже пиво

06:52 Есть ли особеннности в аналитике кофейного бизнеса

11:35 SQL в задачах анализа данных

22:34 Хорошая ли практика - строить ML в SQL

25:00 dbt, Looker и версионирование SQL-кода

41:15 Нужно ли аналитику изучать Python

44:53 Зачем используют MatLab в диссертациях

48:30 Самый любимый BI-инструмент гостя

53:10 Дашборд новоиспечённых родителей

54:24 Динамические дашборды в opensource инструментах

1:08:54 Metabase в качестве BI-инструмента

1:14:42 Как обидеть аналитика данных, или внедрение self-service BI

1:21:20 Бонус для тех кто дослушал


Обложка - собственное творение🙂

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Oct 02, 202101:23:05
18. Apache Superset

18. Apache Superset

Тема выпуска "Apache Superset"!


Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc


Shownotes:

00:35 Кофе с заменителем молока, который приходится любить

02:09 Что такое Apache Superset и зачем его использовать

07:27 Основные функции и типы источников данных

12:12 Насколько сложен инструмент для менеджеров и аналитиков

13:42 Кастомизация

18:47 Внутреннее представление данных и загрузка своих csv/xlsx

20:41 Что можно сделать с данными после их получения

26:16 Доступ и полномочия

29:28 Способы запустить локально и развитие продукта

31:50 Динамические дашборды и Jinja-шаблонизация

34:47 Как обновляются дашборды, realtime и GIS-данные

39:35 Насколько стабилен Superset и чего в нём не хватает

45:27 Зачем забирать данные из Elasticsearch в Superset

46:49 Superset as a Service

49:41 Куда движется Superset

56:18 Три причины использовать Superset


Обложка - https://superset.apache.org

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Sep 25, 202159:17
17. "Умный" дом и его особенности (гостевой)

17. "Умный" дом и его особенности (гостевой)

Тема выпуска "Умный" дом и его особенности

В гостях у подкаста `Data Coffee` организатор DIY-митапов, энтузиаст DIY, умных домов и 3D-принтеров, iOS-разработчик - Вадим Балашов  (Хабр)

Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc


Shownotes:

<