Skip to main content
Spotify for Podcasters
Data Coffee

Data Coffee

By Data Coffee

Подкаст о данных в современном мире. Мнения экспертов и опыт в получении, хранении, обработке, визуализации и принятии решений на основе данных. License: CC BY-NC-ND 3.0 (https://creativecommons.org/licenses/by-nc-nd/3.0/)
Available on
Amazon Music Logo
Apple Podcasts Logo
Castbox Logo
Google Podcasts Logo
Overcast Logo
Pocket Casts Logo
RadioPublic Logo
Spotify Logo
Stitcher Logo
Currently playing episode

81 (S3E14). Данные на стройке

Data CoffeeFeb 18, 2023

00:00
01:13:48
95 (S3E28). Как дата инженерам и аналитикам дружить?

95 (S3E28). Как дата инженерам и аналитикам дружить?

Тема выпуска Как дата инженерам и аналитикам дружить?

В гостях у подкаста `Data Coffee` Игорь Мосягин — Data Engineer в шведской финтех компании Klarna (Twitter, Youtube, LinkedIn)


Shownotes:

0:49 Классический вопрос

3:06 Inverse podcast

7:13 Уровни data security

10:38 Технический стек

14:28 Взаимодействие с аналитиками

16:50 On-boarding

20:50 Аналитики и контроль

25:09 Про Redshift

27:11 Документация и её метрики

30:05 Философия про документацию

31:19 Выстраивание процесса on-boarding

34:45 Самомотивация и quantified self

39:35 Про PhD

50:03 Data catalogue

58:04 Мотивация преподавать

1:06:37 Вдохновение


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 30, 202301:10:00
94 (S3E27). Уязвимость в Telegram, терминал для MacOS и CozoDB
May 20, 202301:00:54
93 (S3E26). Elon Musk, -10x engineer, Airflow, dbt, OMD
May 13, 202301:06:11
92 (S3E25). Зачем писать свой Data Catalog

92 (S3E25). Зачем писать свой Data Catalog

Тема выпуска Зачем писать свой Data Catalog

В гостях у подкаста `Data Coffee` Иван Канашов — Data Engineer в компании Тинькофф (GitHubTelegram)


Shownotes:

0:47 Coffee

3:15 Зачем писать свой датакаталог

6:58 Модель данных каталога

9:08 Обновление данных в каталоге

17:40 Как говорить с бизнесом

21:03 Как решили идти в open source

23:37 Почему метаданные описывают не владельцы

25:20 Как понять, что каталог успешен

27:49 Lineage

29:59 Сколько времени ушло

31:49 Ролевая модель

35:13 Используется ли ML

37:23 Где посмотреть UI

40:18 Выйти и вернуться в IT

45:18 Каждый получает кайф там, где хочет

49:47 People & Data Governance

54:15 Будущее Data Governance систем

55:45 Что почитать и что поучить


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 06, 202359:28
91 (S3E24). Немного про данные и нет кофе (обычный)
Apr 29, 202301:13:05
90 (S3E23). Terrific Microsoft Excel

90 (S3E23). Terrific Microsoft Excel

Тема выпуска Terrific Microsoft Excel

В гостях у подкаста `Data Coffee` Генрих Ананьев — руководитель направления автоматизации отчётности и моделирования в Beluga Group (HabrEmail)


Shownotes:

1:15 Голосование за кофе

3:53 Какое отношение гость имеет к теме

7:35 Alex попытался пройти обучение

9:30 Почему Excel настолько популярен

11:04 Погружаемся в историю

24:40 Почему пользовательская часть популярнее

30:52 Альтернативные табличные процессоры

34:13 Преимущества перед конкурентами

55:30 Анализ данных

1:05:50 Вот Excel, сделайте теперь нормально

1:09:00 PowerPivot и другие надстройки

1:14:52 Можно ли повлиять на roadmap

1:17:45 Lambda-функции в Excel

1:21:25 Популярные проблемы

1:27:58 Игры на Excel


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Apr 22, 202301:30:25
89 (S3E22). Postman Flows, классический Twitter и галлюциногены на Майорке
Apr 15, 202350:55
88 (S3E21). AWS DataZone, YTsaurus, Postman Flows
Apr 08, 202356:48
P1-3. Кофе с психологом
Apr 04, 202301:11:18
87 (S3E20). ChatGPT на помощь учебе и работе

87 (S3E20). ChatGPT на помощь учебе и работе

Тема выпуска ChatGPT на помощь учебе и работе

В гостях у подкаста `Data Coffee` Александр Жадан — brand manager CM Games, интересующийся нейросетями (TwitterInstagram)


Shownotes:

1:41 Кофе

2:30 Выбор темы дипломной работы

5:26 Как двигался процесс подготовки текста

10:01 "ChatGPT написал диплом"?

11:53 Сколько времени ушло на запросы

15:13 Отличие результатов для разных языков

17:09 Кто знал об использовании ChatGPT

18:53 Стилизация текста

20:10 Догадался ли кто-то на защите

22:18 Выход за пределы Twitter

26:33 Злобные академики

41:39 Помогает ли ChatGPT бренд-менеджеру

45:20 Письмо остановить разработку

50:07 Решение в итоге принимать человеку

56:28 Инфляция в искусстве


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Apr 01, 202301:01:11
86 (S3E19). Shopping data, рекомендации, облака

86 (S3E19). Shopping data, рекомендации, облака

Тема выпуска Shopping data, рекомендации, облака

В гостях у подкаста `Data Coffee` Саша Айваз — Chief Data & Analytics Officer, Lamoda Tech (email, Telegram, site)


Shownotes:

0:00 Традиционный вопрос

1:50 Lamoda

11:00 Как формируется предложение и какие данные используются

16:30 Data driven decision

18:15 Какие данные собираются

21:18 Только онлайн шоппинг?

21:53 Где хранятся собранные данные

27:04 Про PowerBI

29:42 Данные по люксовой одежде и ML

41:16 Рекомендации

43:39 Качество данных

48:48 Граница облаков и observability

1:00:47 Как стать CDO


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Mar 25, 202301:12:47
85 (S3E18). ЭЭГ, коагулятор, осьминоги, Silicon Valley Bank
Mar 18, 202355:07
84 (S3E17). Беспилотники и картография
Mar 11, 202301:08:40
P1-2. Кофе с психологом
Mar 05, 202301:18:55
83 (S3E16). YouTube, Bing, EU data salaries и молитвы
Mar 04, 202358:00
82 (S3E15). DuckDB, Docker, AWS, Hashicorp, etc.
Feb 25, 202301:04:03
81 (S3E14). Данные на стройке
Feb 18, 202301:13:48
80 (S3E13). Наукометрия

80 (S3E13). Наукометрия

Тема выпуска Наукометрия

В гостях у подкаста `Data Coffee` Александр Мартиросян — Профессиональный наукометрист.


Shownotes:

0:45 Традиционный вопрос

1:38 Что такое наукометрия

3:23 Можно ли сравнивать по странам

4:22 Что мы измеряем

5:33 Значимость конференций и как померить

6:52 Какие объекты мы можем сравнивать

8:04 Как понять, чьи статьи стоит читать

9:44 Кто стоит за WoS и Scopus

12:29 Что такое impact factor

14:17 Зачем нужны цитирования

17:02 Призрак уробороса

18:18 Аналогия с социальной сетью

19:34 Хаки показателей

20:14 Молчаливо смотрим на огромный Хирш

23:29 Зависть к фабрике статей

24:32 Можно ли доверять индексу Хирша

25:20 Какой индекс Хирша у самого Хирша

25:48 Соревновательная хиршеметрия

26:18 Когда ученый становится таковым

28:14 Накрутка и борьба с ней

29:25 ОПГ Хирш

30:49 Манчкинство показателей

32:25 Денежная мотивация и соблазн

34:36 Ученые-диссиденты и альтернативные показатели

36:27 Создание новых метрик

36:55 Где взять наукометрические данные

40:51 Журналы и квартили

43:35 Data Coffee Conference

46:01 Где образуется научное знание

53:00 Как начать заниматься наукой


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Feb 11, 202301:00:01
79 (S3E12). Новости про утечки Yandex, ChatGPT, и другое
Feb 04, 202301:10:26
78 (S3E11). Путь в data engineering

78 (S3E11). Путь в data engineering

Тема выпуска Путь в data engineering

В гостях у подкаста `Data Coffee` Илья Синёв — Senior Consultant Data Engineering at adesso SE (email, LinkedIn).


Shownotes:

0:00 Внезапно про MacOS9

2:46 Гость выпуска

4:04 Отношения с кофе

7:11 Профессиональная предыстория

12:19 История развивается

13:25 Третий путь

18:50 Немного про low-code

21:38 И немного про data science

22:06 Про Adesso

23:38 Гребем на маленькой галере

25:48 Реалии второй работы в Германии

27:39 И немного databricks

33:12 low-no-code решения

38:30 Текущая ситуация и планы на будущее

39:39 Azure и AWS

42:21 Что бы сделал иначе

44:01 Перспективы и наука

47:30 И в продакшен, наукометрия

52:54 Помогает ли научный опыт

54:39 Физики и data science


Обложка - Midjourney

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jan 28, 202359:36
77 (S3E10). Сокращения, утечки, ChatGPT, Doom и кофе

77 (S3E10). Сокращения, утечки, ChatGPT, Doom и кофе

Jan 21, 202301:10:48
76 (S3E09). Кто такой Тимлид
Jan 14, 202301:12:29
P1-1. Кофе с психологом

P1-1. Кофе с психологом

Кофе с психологом


Многие хотят подслушать, о чем же говорят психологи на самом деле. И желательно так, чтобы это не было похоже на лекцию. А действительно просто беседа.

Поэтому пришла идея этого подкаста.

В первом эпизоде мы решили поговорить о мифах, связанных с психотерапией. На что обращать внимание при выборе психолога, чем в принципе занимается психотерапия и почему она стала входить в нашу жизнь.

А с вами буду я, Ирина Андрейченко психолог-психотерапевт, член Европейской и Санкт-Петербургской Организации Транзактного Анализа.

Предлагаю вам написать - о чем вам хотелось бы подслушать в следующих эпизодах?


Shownotes:

3.00 Intro

4:07 Стереотипы, такси и нарушение границ

7:28 Экономика поглаживаний

9:31 Вымогательство поглаживаний

11:39 Роль менеджера в коллективе

15:18 Зачем нужен психолог если есть друзья

17:59 Ожидания от друзей

20:58 Доверие к психотерапевту

26:23 Контракт с терапевтом

28:19 Каждый делает только для себя

37:10 Зачем мне психолог, я сам разберусь

39:07 Работа с возрастными клиентами

43:30 Вопрос цены

45:30 Если не медицина, то что

46:35 Как найти своего психолога

51:11 Как понять, что пора

53:46 Как побороть скепсис

57:07 Опять про детство

1:03:56 Завершаем


Обложка - Generated by Midjourney

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jan 09, 202301:05:08
75 (S3E08). SetApp, Skypilot, Lastpass leak, 2038
Jan 07, 202301:01:32
74 (S3E07). Итоги уходящего года

74 (S3E07). Итоги уходящего года

Ведущие подкаста "Data Coffee" подводят итоги года!


Shownotes:

0:28 Что для нас хороший кофе

04:13 Статистика подкаста

56:31 Личные итоги каждого

1:13:26 Поздравляем слушателей


Обложка - Midjourney

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat


P.S. лично от Алекса: я завел себе личный канал, где буду делиться своими мыслями обо всем и своими наблюдениями. Если вам интересен мой взгляд на мир или вы хотите больше обо мне узнать, а также, если вы готовы пуститься в споры в комментах — welcome https://t.me/alexseconds. Всем мира!🕊

Dec 31, 202201:19:08
73 (S3E06). Лазер в голову, аудио/видеопомощники

73 (S3E06). Лазер в голову, аудио/видеопомощники

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

1:24 Pub Med GPT

12:04 Tad data viewer

16:43 John Carmack vs. Meta

20:00 DOOM в лампочке

21:28 Монетизация голосовых помощников

29:48 Устройства для видеозвонков

34:46 Лазер в голову

43:10 Дизайн шоколада от Midjourney

45:31 Авторские права на AI-изображения

47:59 AI-generated music

53:28 ComposeFS for Linux

58:06 Почему ты все еще джун


Обложка - Generated by Open-AI

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 24, 202201:27:04
72 (S3E05). DOOM на елке, Midjourney, ChatGPT

72 (S3E05). DOOM на елке, Midjourney, ChatGPT

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

0:33 Поговорили немного про кофе

3:14 Как спасаться от болезни Альцгеймера

8:26 Фриланс в дата инжиниринге

17:29 Удобство Terraform и IaaC

18:52 ChatGPT

27:07 Midjourney

35:48 Профессия художник

41:25 Airflow 2.5.0

42:03 Elon Musk vs. Twitter

44:26 Еще про нейросети

47:44 Елочная игрушка с DOOM

50:11 Asahi Linux на Apple M2


Обложка - Generated by Midjourney

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 17, 202256:00
71 (S3E04). Minimal modeling

71 (S3E04). Minimal modeling

Тема выпуска Minimal Modeling

В гостях у подкаста `Data Coffee` Алексей Махоткин — автор концепции Minimal Modeling (сайт, рассылка, видео1, видео2).


Shownotes:

0:38 Я постоянно его пью

2:14 Что это такое

3:51 Как это соотносится с 3NF

5:18 Как выглядит модель

7:36 Как заполнять описание

10:39 Кто это будет заполнять

17:13 Минимальная модель Twitter

20:07 Что делать с моделью

22:44 Зачем SQL в модели

24:07 Почему не работает Anchor

26:39 А если уже есть Data Catalog

34:24 В какой момент это нужно

44:43 Как объединить разные БД

49:16 Как жить с этим в большой компании

51:58 Устойчивость к изменениям

1:00:06 Практика применения


Обложка - OpenAI Dall-E, promt="Minimal Modeling"

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 10, 202201:03:21
70 (S3E03). Конспирология, nlp2sql, SQL for CSV

70 (S3E03). Конспирология, nlp2sql, SQL for CSV

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

2:52 Разделение одной неназванной компании

5:52 Дальнейшее разделение

7:39 Почерневшая ягода

11:43 Что-то нас много стало

13:09 Конспирология теперь и в нашем подкасте

17:51 Diagram as a Code

20:20 Excel BigData

23:37 SQL for CSV

25:58 nlp2sql

30:39 DockerHub и безопасность

35:59 Игры на выживание

38:54 И вновь doom

42:54 Stable Diffusion 2.0

44:56 Нововведения в whatsapp и ICQ

50:10 GPT3 в google sheets


Обложка - Generated by DALL-E 2, prompt "Aliens and exploding watermelon in a desert"

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 03, 202251:50
69 (S3E02). Метрики и аналитика сна
Nov 26, 202201:04:05
68 (S3E1). Любим Airflow, ругаем Apple, задаем вопрос слушателям

68 (S3E1). Любим Airflow, ругаем Apple, задаем вопрос слушателям

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

4:28 Увольнения и природные катаклизмы

6:56 Твиттер

11:52 Твиттер и телеграм, подписки

17:19 Пресловутая связь роста и зарплаты

19:36 Estante suave

20:25 Радикальное изменение в подкасте

20:46 Massive layoffs

21:34 Последнее обновление macos

26:06 Классически про Airflow

30:27 Немного про ubuntu 22.10

34:42 Потеряли дата-инженеров в подкасте

35:30 Doom на Airflow

38:30 Про дельфинчика

40:59 Natural language to SQL query

45:11 AWS Code Whisperer

48:07 Shutterstock и DALL-E

51:28 Вопрос к слушателям по поводу S3

53:16 Asahi Linux на M1


Обложка - Generated by DALL-E 2, prompt "airflow, painting by Matisse"

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Nov 19, 202256:13
67 (S2E25). Организация data-конференций

67 (S2E25). Организация data-конференций

Sep 24, 202201:04:48
66 (S2E24). iOS, Airflow, Doom, and biomedicine
Sep 17, 202201:04:38
65 (S2E23). Data catalogs

65 (S2E23). Data catalogs

Тема выпуска Data Catalogs

В гостях у подкаста `Data Coffee` Data Engineer из компании Picsart — Алмаз Мурзабеков (Telegram, Email)


Shownotes:

0:56 Чашку-другую, но не сбивая биоритмы

1:45 Кто такой DI engineer

6:52 Что такое data catalog

11:20 Meta-информация

17:21 Как заполняется data catalog

20:32 Amundsen, OpenMetaData

26:15 Atlan

31:39 Структура бизнес-глоссария

33:06 Как продать data catalog руководству

36:21 Чем заниматься DE после внедрения

39:58 Витрины как сервис

41:03 Algorithm-based decision making

42:48 Критерии выбора data-каталога

46:15 DQ и интеграция с мессенжерами

48:58 Data catalog on top of file system

51:44 Data exploration

54:11 Сколько проект займет в людях

57:02 Как сделать MVP


Обложка - Michael Holley Swtpc6800, Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Sep 10, 202201:02:15
64 (S2E22). Прослушка, file system SQL, psycopg и другое

64 (S2E22). Прослушка, file system SQL, psycopg и другое

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

1:40 ДР в подкасте

3:12 Stream deck

7:13 Дум на тракторе

8:22 Подслушивание через оптоволоконный кабель

13:21 SQL для файловой системы

16:29 Новость от слушателя

18:55 Тема от слушателя, галера или in-house

33:09 Дальний космос в колбасе

35:10 TikTok, дипфейки и брюзжание

37:57 20 лет Shazam

40:25 Про яндекс, поиск и обмен сервисами

44:59 Diablo 1 в браузере

46:02 Немного про GeForce Now

48:45 MacPass

50:15 DbGate

51:59 Heroku убирает бесплатные тарифы

52:55 Когда забанили в гугле


Обложка - Joaquim de Mello (book author), Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Sep 03, 202256:03
63 (S2E21). Data Management Platform

63 (S2E21). Data Management Platform

Тема выпуска Data Management Platform

В гостях у подкаста `Data Coffee` руководитель команды продукта Data Management Platform в Яндекс GO — Максим Пчелин (LinkedIn, Telegram)


Shownotes:

00:42 Кофе: важно не какой, а где

02:15 На пути к данным

06:07 Любимая роль на проектах

07:30 Кто такой data platform product owner

09:45 Плохо пахнущие субстанции в консалтинге

14:28 Какая из работ была лучше

16:24 Легко ли даются трансформации из роли в роль

20:52 Синдром самозванца - хороший признак

25:13 Планнинг дел в Telegram

29:20 Как не страдать от невыполненных дел

33:04 Разница между DWH и data platform

39:55 Как общаться с админами

43:25 Как разбираться в людях

47:30 Что действительно нужно аналитикам

52:22 Как делать DWH гибким

55:06 Где искать людей на работу

59:28 Сколько будет 2 в 10й степени


Обложка - Adam37, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Aug 27, 202201:02:10
62 (S2E20). VR, змеиный экзоскелет и новинки медицины
Aug 20, 202256:36
61 (S2E19). Reverse ETL, проблемы в cloud и расточительство пакетных менеджеров
Aug 13, 202201:03:21
60 (S2E18). dbt — data transformation workflow

60 (S2E18). dbt — data transformation workflow

Тема выпуска dbt

В гостях у подкаста `Data Coffee` Lead Data Engineer в компании NabuMinds — Никита Баканчев (LinkedIn, Telegram)


Shownotes:

0:48 Кофе 

1:32 Что такое dbt

2:56 Истинная сущность dbt

4:56 Что нужно сделать, чтобы он взлетел

10:06 Как это всё запустить

13:27 Где подводные камни

14:48 Миграция

17:00 Отличие core от cloud

19:53 Как понять, что пора

22:53 Степень зрелости проекта

25:24 Изменения в моделях

28:05 Отладка макросов

29:31 dbt test

31:25 lineage и dbt docs

35:19 Работа с разными DB

36:28 data quality и dbt

42:23 dbt community

44:42 Полезные dbt-пакеты

53:29 Легко ли слезть с dbt


Обложка - dbt

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Aug 06, 202258:32
59 (S2E17). Пауки, нейроинтерфейсы, восстание машин и немного IT
Jul 30, 202201:02:04
58 (S2E16). Приоритеты, финансы, роботы, нейросети и данные
Jul 23, 202238:05
57 (S2E15). Музыка, прогнозы, саранча, и немного про дирижабли
Jul 16, 202201:10:07
56 (S2E14). Edge ML

56 (S2E14). Edge ML

Тема выпуска Edge ML

В гостях у подкаста `Data Coffee` Data Scientist в компании Dannie — Елена Шевченко


Shownotes:

00:52 Классический вопрос

02:13 Начало карьеры

04:03 Чем плох R

05:40 Дебаты R vs Python

07:01 Непростой путь в DS

07:45 Что такое Edge ML

10:05 Потенциальная потеря полезной информации

10:17 Соотношение точность-полнота

12:58 Когда разумно использовать edge устройства

16:31 Майнинг на edge устройствах

17:12 Дообучение моделей после кражи устройства

18:13 Почему эта сфера и не крупная компания

21:03 Небольшие проекты и беспилотники

22:10 Стоимость edge устройств

23:59 Процесс разработки под edge устройства

28:35 Как обычному DS пощупать edge ml

29:44 Про квантование

34:59 Ассоциация с обучением с подкреплением

36:23 Языки имплементации

38:16 Android и edge ml

40:01 Работа с большими моделями

42:50 Есть ли работа для data engineer

43:57 Внезапный podcast inversion of control

44:11 IoC: Бигада в датакофе

44:52 IoC: Глубокие нейронные сети

45:54 Как попасть в эту сферу 47:12 NLP на устройствах

48:38 Немного про voice recognition

49:25 edge ml своими руками

49:55 IoC: искуственный интеллект

51:05 Как модель положить в железку и дообучение

52:49 Контроль качества

55:40 Создание обучающей выборки

56:17 Embedded разработчики

57:17 Дорогие дата-сатанисты

58:00 Как проверить DS

59:38 Менеджер-дата-сатанист

1:01:10 DL как black box

1:01:45 Вопрос от друга

1:03:47 Первый шаг в DS

1:05:31 Проходим собеседование вместе

1:08:08 Накидываем на лингвистику


Обложка - Jing.fm, CC BY-SA 4.0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jul 09, 202201:09:43
55 (S2E13). IE retirement, Telegram Premium, Excel, datadiff
Jul 02, 202201:02:25
54 (S2E12). Беседа про собеседования

54 (S2E12). Беседа про собеседования

Тема выпуска "Беседа про собеседования"!


Обложка - Freepik, CC BY-SA 3.0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jun 25, 202201:12:33
53 (S2E11). WWDC22, Natasha, Bergamot & AI has come to life
Jun 18, 202201:07:47
52 (S2E10). Игры на работе

52 (S2E10). Игры на работе

Тема выпуска Игры на работе

В гостях у подкаста `Data Coffee` game designer из Kama Games — Коля Юн


Shownotes:

1:55 Кофе

3:20 Как гость шёл в геймдизайн

11:39 Как попасть в геймдизайн

14:15 Первый месяц на новой работе нужно играть

15:52 Feature review

19:00 Неудачная фича

21:35 Что нужно знать геймдизайнеру

23:20 Нужно ли художественное образование

25:00 Какие дизайнеры есть на игровом проекте

29:10 Можно ли из аналитика попасть в геймдиз

32:01 product_manager == game_designer

34:20 Куда может вырасти геймдизайнер

36:30 Тайное желание гостя

38:50 Требуемые skills геймдизайнера

43:50 На кого все геймдизайнеры пытаются равняться

46:25 Три любимые компании

48:10 Кодзима — гений?

50:00 За какой платформой будущее


Обложка - National Gallery of Art, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jun 11, 202256:44
51 (S2E9). KDE Connect, хранение секретов и нанороботы
Jun 04, 202201:05:36
50 (S2E8). Кофейный-юбилейный

50 (S2E8). Кофейный-юбилейный

Тема выпуска Кофейный-юбилейный

В гостях у подкаста `Data Coffee` PM в DWH в Yandex.Go, автор канала Coffeeinmsk — Анастасия Королёва (Telegram, LinkedIn)


Shownotes:

01:47 Обязательный гостевой вопрос

03:35 Как научиться заваривать кофе в турке

06:04 Турка из серебра — стоит того?

08:19 Откуда все эти знания о кофе

10:57 Какую кофеварку покупать домой

14:36 Как погрузиться в мир кофе

17:40 Как искать кофе в новом месте?

24:17 Что такое кофе specialty?

27:38 Кофейный снобизм

29:45 Существует ли достойный растворимый кофе

31:47 Правильное начало кофейного пути

39:00 Когда лучше молоть зёрна

43:20 Альтернативное молоко

48:35 Кофе без кофеина

50:52 Как выбрать кофе для джезвы

54:14 Биодинамика

55:09 Coldbrew


Обложка - gnokii at openclipart.org, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 28, 202201:02:10
49 (S2E7). VR-шлем с отдачей, регуляция ML-сервисов и наноботы
May 21, 202201:12:43
48 (S2E6). Cooking stages, pizza scientists и индейка в мандаринах

48 (S2E6). Cooking stages, pizza scientists и индейка в мандаринах

Тема выпуска Cooking stages, pizza scientists и индейка в мандаринах

В гостях у подкаста `Data Coffee` Data Engineering TechLead в Dodo Engineering, член программного комитета SmartData, DE or DIE data engineering digest редактор и организатор митапов DE or DIE — Ксения Томак (LinkedIn, Twitter, DE or DIE)


Shownotes:

1:06 Кофейный вопрос

1:51 Чем занимается TechLead

5:10 Какие данные собираются про пиццу

10:32 Поиск маршрутов

12:10 Эксперименты с рецептами и RnD

18:26 Прогноз закупки ингредиентов

19:36 Что нужно уметь, чтобы попасть в Pizza RnD

20:49 Рекомендационная модель

24:50 Контроль качества продуктов по фото

28:40 DoDo BI

32:30 "Умная" пиццерия

33:29 Переход PowerBI-Superset

36:24 Франчайзинговый "каннибализм"

37:46 Никакой пиццы после полуночи

39:37 Переход на data-driven подход

43:52 Доставка пиццы дронами

48:35 DEorDIE community

56:58 Поиск участников и докладов

1:00:44 Работа для борьбы с синдромом самозванца


Обложка - public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 14, 202201:03:29
47 (S2E5). Курсы для новичков, менторы и community

47 (S2E5). Курсы для новичков, менторы и community

Тема выпуска Курсы для новичков, менторы и community

В гостях у подкаста `Data Coffee` junior data engineer, автор канала Girl DataEng и создатель чата для начинающих дата инженеров DataYoungers — Анна Строевская (Telegram)


Shownotes:

01:04 Кофе — это вид снотворного

01:42 Вопрос, который беспокоит всех

04:07 Вопрос, который беспокоит Дину

07:43 Скиллы, которые помогли

08:53 Что мешает новичку в профессии

12:39 Как гостья готовилась к DE

15:14 Противоречивые курсы

16:56 DE и аналитик: разные взгляды на задачи

19:07 Переход в DE: составляющие успеха

23:07 Почему не аналитика или ML

26:27 Что зажигает в работе DE

28:50 Никто не умеет писать код

32:49 Куда хотелось бы расти

34:48 Как подступиться к проблеме с задачей

39:03 Community для новичков

43:59 Приглашают ли джуна на обсуждения

45:42 Синдром самозванца у новичков

48:26 Кому задать вопросы первого дня


Обложка - Ryan Riggins ryan_riggins, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 07, 202255:23
46 (S2E4). Дирижабли, кнопка Mute, Twitter Илона Маска, etc.
Apr 30, 202201:00:01
45 (S2E3). xLookUp, Dataminer, RegExp for Email, Doom w/raytracing
Apr 23, 202201:06:15
44 (S2E2). Метеорология, ледники и голодные медведи

44 (S2E2). Метеорология, ледники и голодные медведи

Тема выпуска Метеорология, ледники и голодные медведи

В гостях у подкаста `Data Coffee` метеоролог, младший научный сотрудник Арктического и Антарктического научно-исследовательского института — Ульяна Прохорова (Instagram)


Shownotes:

2:05 30 лет и переосмысление кофе

3:05 Метеорология, океанология и экспедиции

6:42 Голодные белые медведи

8:58 Первая экспедиция

11:29 Граница между метеорологией и океанологией

12:03 Данные в метеорологии

18:19 Тепловой баланс ледника

21:32 Верификация данных

23:33 Что мы будем с этого иметь?

27:22 Мировые центры данных

28:17 Реанализ

32:40 Хаос в форматах данных

34:10 Квадрат или шестиугольник?

35:12 "Через две минуты дождь кончится"

36:52 Метео-краудсорсинг

40:50 Доступ к собранным данным

42:35 Как ещё можно помочь науке

44:00 Климатические параметры

49:07 Статьи про ледники

50:00 Как происходит процесс сбора данных

54:44 Как располагается сеть наблюдений

56:04 Допустим, я инженер данных

1:05:07 Заруб с p-value

1:06:49 Куда идти учиться


Обложка - Author, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Apr 16, 202201:10:14
43 (S2E1). Twitter, DALL-E, Ubuntu 22.04, PyTorch, а также психоделики

43 (S2E1). Twitter, DALL-E, Ubuntu 22.04, PyTorch, а также психоделики

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


1:08 Последний кофе Алекса

2:16 Диаграммы в github markdown

8:49 Про личную базу знаний и Obsidian

13:05 Новости про твиттер

16:31 Наивные размышления про рынки ценных бумаг

22:18 Быстрая имплементация pytorch для M1

25:11 Инстанцы на M1 в AWS и немного любимого Airflow

29:00 DALL-E 2

33:53 Don't look up great again

39:00 Ubuntu 22

46:28 dockerized

50:41 Психоделики и нейроинтерфейсы


Обложка - cogdogblog, CC BY 2.0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Apr 09, 202259:23
42. Как жить?
Mar 05, 202201:10:33
40. Игровая аналитика как она есть

40. Игровая аналитика как она есть

Тема выпуска Игровая аналитика как она есть

В гостях у подкаста `Data Coffee` руководитель направления аналитики в My.Games — Олег Потапов (Facebook)


00:58 Традиционно про кофе

01:56 Зачем в играх нужна аналитика

04:32 Нужен ли аналитик до того, как игра стала хорошей

08:12 Как выбрать хорошего аналитика

11:36 Конкретные скиллы в аналитике

16:55 Аналитические метрики

24:12 Как можно донести свое видение до проекта

27:44 Верят ли разработчики решениям от аналитики

29:10 Метрики, направленные на отдельных пользователей

31:12 Успешность проекта и Factorio

36:31 Как проводятся АБ тесты

43:04 Исследования на разных типах игроков

45:32 Процент играющих людей по отношению к проекту

47:44 Метрики, чтобы понять, что дело не стоит свеч

50:38 Стоит ли пилить фермы ради денег

53:01 Любимый проект гостя

55:57 Когда стоит принять то самое грустное решение


Обложка - Metropolitan Museum of Art, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Feb 19, 202201:02:37
39. Маркировка рабочих, философия, и базы данных

39. Маркировка рабочих, философия, и базы данных

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

02:37 Auchenberg/volkswagen определяет, что тесты зап...
05:37 История с распределенной базой на sqlite развив...
10:27 10 лет AWS DynamoDB - NoSQL база данных single-...
13:52 Отличия в парсерах PNG у Apple и остальных
20:31 Майнинг в Иркутске
23:23 EdgeDB 1.0 release - first open source graph-re...
27:41 Стартап Engineer.ai, позиционирующий себя как р...
33:34 Описываем свой SQL на естественном языке и выпо...
37:01 Закрывают IBM Watson Health по кускам и продают...
37:18 Интересная штука, может попробую: естественный...
40:40 После анализа бигдаты было принято решение увол...
42:18 Рабочих мясокомбината в Набережных Челнах «пром...
53:57 Живая нейросеть общего назначения
56:10 Дрон гоняет голубей в Швейцарии смотреть до кон...
01:01:21 Атаки на NLP-системы: невидимые пробелы, подмен...
01:09:33 Айтишник не может зарабатывать меньше 4000$, он...


Обложка - Smallbones, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Feb 12, 202201:09:02
38. Snowflake Data Cloud

38. Snowflake Data Cloud

Тема выпуска Snowflake Data Cloud

В гостях у подкаста `Data Coffee` автор канала Сингулярности не будет, фаундер holistic.dev, dwh.dev и parsers.dev, заводила в snowflake чатах (ru, en) и канале со snowflake новостями — Антон Ревяко


Shownotes:

02:04 Две нижегородские кофейни

06:18 Что за мифический зверь Snowflake

10:48 Обновления в облачных базах

15:20 Статические анализаторы кода

19:16 Что под капотом у Snowflake

20:45 Можно ли запустить в private-облаке

26:19 Data Marketplace

30:20 Выгодные преимущества Snowflake

34:26 Специфические (не)удобства

52:51 Поддержка ML

57:32 Кому Snowflake точно не подойдёт

58:54 Проекты гостя


Обложка - Gagea, Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Feb 05, 202201:15:22
37. Open source, котики, мемы и новости

37. Open source, котики, мемы и новости

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

00:40 Мак и мак (долгий блок)

18:33 Коротко про faker

19:53 Проблемы онлайн-курсов

21:44 Дыры в open source (получение рута)

22:50 Нововведения в superset

28:49 Пилить ли свой ETL

31:28 Обилие курсов для новичков

35:13 Про крипту и центробанк

37:51 Искусственный зрительный аппарат

41:01 Мечты о second brain

43:41 Раздача интернета с дирижаблей

46:30 Starlink и котики

48:21 Мемы по мотивам log4j

49:01 Распознавание голосов птиц

50:01 Стандарт многоквартирного умного дома

55:06 AirTag и слежка

57:31 Удерживающие собеседования

01:02:12 Заканчиваем историей про именование серверов


Обложка - Auckland Museum, CC BY 4.0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jan 29, 202201:10:07
36. Тестирование программного обеспечения (гостевой)

36. Тестирование программного обеспечения (гостевой)

Тема выпуска Тестирование программного обеспечения

В гостях у подкаста `Data Coffee` QA Lead в JetBrains, ведущая подкаста "Вроде в проде", ментор и консультант на тему автоматизации и тестирования - Саша Пшеборовская (Twitter, Instagram, LinkedIn, Подкаст, GetMentor)


Shownotes:

02:42 Традиционный вопрос про кофе

04:44 Что такое тестирование

11:14 Можно ли обойтись без тестирования

14:43 Автоматизированное или ручное

20:52 Противостояние тестировщиков и разработчиков

26:40 Почему разработчики сами не тестируют

27:32 Методологии тестирования

31:28 Обилие курсов для новичков

33:37 Войти в ИТ через тестирование

38:09 Популярные фреймворки для тестирования

40:47 Методы тестирования в data-продуктах

46:12 Data quality и тестирование

53:00 Как устроена работа в команде

56:34 Формальная верификация и связь


Обложка - Blobbie244, CC BY-SA 3.0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jan 22, 202201:02:36
35. Первый iPhone, немного бигдаты и много электричества

35. Первый iPhone, немного бигдаты и много электричества

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

01:02 15 лет назад был анонсирован первый iPhone
12:18 Смартфон запитал бумажный синтезатор по NFC
18:56 🔗 Ford представил технологию зарядки электромоб...
33:39 Устройство определяющее наличие вредоносного П...
40:01 В Японии заработают автобусы-поезда
44:25 Hyundai показала тележку-робота MobED. Она осна...
48:26 Customizable ноут я этой штуки не видел может...
54:39 Маленький кабинет для себя на 9м^2 во дворе сб...
57:45 Отличное завершение года считаю. В сеть выложи...
1:01:48 В августе в соцсетях разошлось письмо основател...
1:12:56 Polars – быстрая библиотека подготовки данных к...


Пара дополнительных ссылок, упомянутых в шоу:

https://flipperzero.one/

https://www.kiteboard.io/


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jan 15, 202201:14:43
34. Первым делом самолёты (гостевой)

34. Первым делом самолёты (гостевой)

Тема выпуска Первым делом самолёты (и их данные)

В гостях у подкаста `Data Coffee` технический директор S7 ТехЛаб, инновационного подразделения S7 - Андрей Жуков (Telegram, Facebook)


Shownotes:

01:35 Coffee
03:17 Что за инновации творятся в S7
13:46 Как шла цифровизация
21:24 Данные, получаемые с самолетов
31:33 Платформа данных
39:06 Управление хаосом
43:07 DS и ML по данным с самолетов
46:19 Команда
53:25 Инструменты обработки данных
01:02:10 Вклад в open source


Обложка - PolyLingua, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Jan 08, 202201:03:59
33. Подводим итоги года
Dec 31, 202101:42:57
32. Personal Knowledge Management (гостевой)

32. Personal Knowledge Management (гостевой)

Тема выпуска Personal Knowledge Management

В гостях у подкаста `Data Coffee` Machine Learning Engineer at ExB Labs - Сергей Гамоцкий (Сайт, Telegram, LinkedIn)


Shownotes:

00:23 Coffee

03:23 Personal Knowledge Management System: что такое...

07:42 Какая информация критична для потери

08:41 Что гость хранит в PKMS

10:44 Как искать то, что давно сохранено и забыто

17:31 Категории, tags и другие атрибуты

21:19 Какой системой пользуется гость

27:21 Насколько просто переносить базу в другие инстр...

30:49 Как заставлять себя вносить информацию в базу

35:53 Так ли много типов информации, чтобы заводить PKMS

40:34 Как правильно записывать информацию

43:20 Поиск по базе знаний

48:01 Философия персональной базы данных

50:06 Zettelkasten

53:17 Johnnydecimal

55:57 Digital garden

01:02:06 Насколько важно, чтобы инструмент был быстрым,...


Обложка - Duke Innovation Co-Lab, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 25, 202101:06:45
31. Выйти из IT и зайти нормально, AWS, Pandas, супер-кабель

31. Выйти из IT и зайти нормально, AWS, Pandas, супер-кабель

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

02:56 Не уйти ли из айти

19:10 Маркетолог-IT-священник. Как вам такой путь?

23:34 Техника определения скрытых камер при помощи To...

31:09 Катастрофическая уязвимость в Apache log4j

32:12 AWS лежал больше 4х часов

35:07 Злоумышленники и AirTag

39:09 Путь Мака от кровати до хоумофиса теперь застра...

42:17 Зарядный кабель, который в свернутом состоянии...

47:26 3dfx никогда не выпускала Voodoo 5 6000 с четыр...

49:10 Удобный инструмент для изучения Pandas

49:12 3dfx никогда не выпускала Voodoo 5 6000 с четыр...

51:04 23 декабря 2021 года завершение разработки Pyth...

52:27 Как прогуливать встречи в Zoom с помощью Python

59:19 Rqlite - распределенная реляционная БД на основ...

1:01:31 В Оксфорде испытали нейросеть с 530 млрд параме...

1:09:13 Кофе подорожает

1:10:37 Второй апдейт для ремастера quake 1


Обложка - Public Domain

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 18, 202101:13:11
30. Аспирантура в области QnA-систем (гостевой)

30. Аспирантура в области QnA-систем (гостевой)

Тема выпуска Аспирантура в области QnA-систем

В гостях у подкаста `Data Coffee` Аспирант Университета ИТМО - Павел Ефимов (Google Scholar)

14 декабря 2021 года пройдет бесплатная онлайн-конференция DataStart по Data Science, машинному обучению и нейросетям. Узнайте о самых последних решениях в мире Data Science! Трансляция будет абсолютно бесплатной, но если вы хотите купить видеозаписи, то специально для наших слушателей есть промокод: сoffee500


Shownotes:

01:59 Отношение к кофе

02:49 Работа в университете

03:29 Какие языки считаются слаборесурсными

07:03 Что такое вопросно-ответный поиск

10:43 Фактологические вопросы

12:04 Поиск ответа в тексте

15:06 Архитектура QnA системы

16:19 Что такое ридер и как оценивать качество QnA

18:35 Можно ли обойтись без ML

22:36 Языковые модели

23:57 Word embeddings

27:55 Король - мужчина + женщина = ?

32:26 Какие модели используются сейчас для NLP

32:50 Трансформеры

36:22 Берт и другие жители Улицы Сезам

39:06 Лимиты в QnA-системах

41:04 Особенности национальной аспирантуры

43:31 Можно ли использовать в своих целях результаты исследований

45:17 Что есть интересного и перспективного в NLP

51:00 Векторный поиск "по-старинке" и современный

54:32 Самостоятельное обучение новичка в QnA

56:18 Какие языки программирования используются


Обложка - Therain, Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 11, 202101:00:18
29. Oxxxymiron, нейросети, единые стандарты и монополисты

29. Oxxxymiron, нейросети, единые стандарты и монополисты

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!

14 декабря 2021 года пройдет бесплатная онлайн-конференция DataStart по Data Science, машинному обучению и нейросетям. Узнайте о самых последних решениях в мире Data Science! Трансляция будет абсолютно бесплатной, но если вы хотите купить видеозаписи, то специально для наших слушателей есть промокод: сoffee500


Shownotes:

02:08 Изучение эволюции человеческих концепций с помощью зондирования

08:06 NVIDIA GauGAN2 создаёт фотореалистичные изображения

12:08 "Визуальная" база данных в PNG

14:33 Избыток медиаконтента сегодня и Oxxxymiron

21:42 WinAMP собираются оживить

23:35 Единый стандарт для "умного" дома

26:11 USB-C как единый стандарт для зарядки

32:38 Опровержение про MuzeNet

34:37 Платное беспилотное такси

35:53 Дуров давит на сторонние Telegram-клиенты

38:44 VR-перчатка от Meta

40:07 Новости от AWS

42:04 Завершение поддержки Firefox Lockwise

50:10 JetBrains DataSpell и Gateway

53:05 Оптимизация NumPy в десятки раз


Обложка - Metropolitan Museum of Art, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Dec 04, 202159:53
28. Анонимность при поиске работы, IT-курсы и другое (гостевой)

28. Анонимность при поиске работы, IT-курсы и другое (гостевой)

Тема выпуска Анонимность при поиске работы, IT-курсы и другое

В гостях у подкаста `Data Coffee` Founder & CEO Get me IT - Дима Доброхотов (Facebook, Хабр)

14 декабря 2021 года пройдет бесплатная онлайн-конференция DataStart по Data Science, машинному обучению и нейросетям. Узнайте о самых последних решениях в мире Data Science! Трансляция будет абсолютно бесплатной, но если вы хотите купить видеозаписи, то специально для наших слушателей есть промокод: сoffee500


Shownotes:

01:47 Усыпляющий кофе

03:34 Переводы, туризм, продажи, HR и IT

05:34 Зачем нужна анонимность при поиске работы

11:25 Реально ли быть анонимным в сети

16:43 Что плохого, если вас постоянно одолевают рекрутеры

19:22 Как сложно рекрутерам в Европе

23:30 Зачем компаниям анонимные соискатели

27:49 Инструменты для сбора данных о кандидатах

32:24 Анализ качества кода соискателей в GitHub

39:50 IT-курсы и трудоустройство после них

45:43 Нужен ли технический background для IT

48:56 Считает ли гость свой переход в IT успешным

57:27 Лопата и яблоки, или самостоятельное обучение


Обложка - Jorjum, CC0, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Nov 27, 202101:07:23
27. Кнопка Turbo, таблицы, "отжим" и метавселенные

27. Кнопка Turbo, таблицы, "отжим" и метавселенные

Nov 20, 202101:03:10
26. Орнитология и birdwatching (гостевой)

26. Орнитология и birdwatching (гостевой)

Тема выпуска Орнитология и birdwatching


В гостях у подкаста `Data Coffee` профессиональный орнитолог и бёрдвотчинг гид, преподаватель Биологического факультета МГУ, лектор в проектах Московского зоопарка и Политеха, автор проекта о птицах и природе Lyric Forester - Григорий Евтух (Telegram, Instagram, Facebook, VK)


Shownotes:

00:38 Bird-friendly coffee

04:33 Традиционный вопрос

05:31 Что изучают орнитологи

09:14 Теория или полевые исследования

11:01 Почему именно орнитология?

12:23 Зачем метить птиц и как собирать данные

16:03 Можно ли самому понять, какую информацию несет метка на птице

19:36 Помогает ли исследованиям информация о найденных меченых птицах?

21:48 Существует ли база знаний о миграции птиц?

23:46 Более современные способы сбора информации о птицах

28:32 История с большими счетами за роуминг

31:03 Crowd funding исследовательских проектов

34:08 Что происходит с собранными данными

36:09 Выводы и решения на основе данных

39:53 Распознавание птиц по звуку и фото

44:12 И снова про crowd sourcing

47:38 Открытые научные вопросы в орнитологии

55:22 Что нужно делать, чтобы стать орнитологом

57:56 Самая любимая птица


Обложка - U.S. Fish and Wildlife Service, Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Nov 13, 202101:02:22
25. Нейросети, майнинг, TouchBar и выбор компьютера

25. Нейросети, майнинг, TouchBar и выбор компьютера

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!


Shownotes:

02:27 Сбой в магазине Ozon

06:34 Redis 3 не поддерживает Arm64

07:34 Удобства TouchBar

08:50 При этом TouchBar нужен не всем

10:49 Проблемы у Facebook и размышления про Meta

17:55 MacOS Monterey и Apple Fitness+

27:00 Какой компьютер покупать Mak’у

31:02 Генерация картинок по русскому тексту в нейросети от Сбера

36:12 Нейросеть от Сбера, но в области медицины

42:50 И ещё одна нейросеть, но уже от Facebook, работающая на звуковых волнах

49:33 Сбор данных с камер, установленных в торговых центрах Москвы

51:06 Трекинг активности работников в Китае

52:10 Продолжение истории с XSolla

54:39 Ограничение работы систем распознавания лиц и сбора данных в Европе и Австралии

1:01:06 Майнинг криптовалют на попутном газе при добыче нефти

1:04:00 Эмбеддинги логотипов метал-групп


Обложка - сгенерирована нейросетью ruDALL-E

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Nov 06, 202101:05:50
24. Что скрывает в себе Маруся? (гостевой)

24. Что скрывает в себе Маруся? (гостевой)

Тема выпуска Что скрывает в себе Маруся?


В гостях у подкаста `Data Coffee` руководитель разработки backend голосового помощника "Маруся" - Вадим Пуштаев (Facebook)


Shownotes:

02:43 Кофе можно пить любой

04:07 Как нас подслушивает Маруся

08:20 Маруся и Беларусь

10:09 Определение владельца локально

11:15 Можно ли поменять Марусе имя

13:22 Анализ детских голосов

16:40 Кто размечает данные

17:50 Что если у взрослого детский голос

19:39 Как устроена цепочка обработки запроса

24:30 Выбор подходящего навыка для ответа

26:54 Оценка качества работы

28:28 Использование пользовательских запросов в улучшении сервиса

29:47 Самые интересные навыки

32:32 Разработка сторонних навыков для Маруси

37:24 Какая статистика собирается

39:54 Кодекс этики ИИ

45:19 Влияние исходных данных на результаты

47:58 “Занавески” и “штора”: умный дом

52:29 Могут ли поспорить две Маруси

54:44 Журнал запросов и доступ к внешним сервисам

1:02:06 Регистрация внешних skills

1:05:08 Голосовые помощники вне дома-офиса


Обложка - Orion 8, Public domain, via Wikimedia Commons

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Oct 30, 202101:09:31
23 (bonus). Куда развиваться?
Oct 24, 202127:48
22. Airflow, Snowflake, пиво и зарплаты DE
Oct 23, 202101:10:12
21. Найм в ИТ и семь "смертных грехов" вашего резюме (гостевой)

21. Найм в ИТ и семь "смертных грехов" вашего резюме (гостевой)

Тема выпуска Найм в ИТ и семь "смертных грехов" вашего резюме

В гостях у подкаста `Data Coffee` T&D Project manager at Intella - Анастасия Пилькевич (LinkedIn, Facebook)


Shownotes:

02:38 Что такое t&d?

03:17 Отношение к кофе

04:12 Что происходит с наймом в it сегодня

06:30 Влияние пандемии на рынок найми

10:07 Найм в условиях дефицита кадров

18:03 Cтранные места для хантинга

19:15 Самые странные требования к кандидатам

21:12 Как создается профиль будущего кандидата

23:11 Как тестируются soft-skills и пост-оплата

25:17 7 смертных грехов в резюме

28:13 Переход из it в it-рекрутеры

29:26 Определение зарплаты для новой вакансии на основе данных о рынке

31:21 На сколько поднялись зарплатные ожидания в последние 1-2 года

34:20 Торги на собеседовании

36:52 Чаще ли стали торговаться?

37:43 Удалённая работа (плюсы и минусы)

41:23 Что делать, когда на рынке 20% выгоревших людей

44:59 Как добиваться повышения зарплаты

52:36 Необычные переходы между профессиями

53:42 Насколько этично предлагать вакансию по diversity квоте

55:28 Cultural fit (с обеих сторон)

1:03:58 Как заранее понять, что кандидат с опытом собеседований, но без технического опыта

1:10:49 Влияет ли уровень образования на зарплату кандидата

1:12:24 Вакансия в my games, data engineer

1:12:54 Как слабой команде нанять сильного инженера

1:18:17 Послешоу, про вторжение в личную жизнь


Обложка - The Seven Deadly Sins and the Four Last Things, Public domain

Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Oct 16, 202101:19:49
20. Python, PgSQL и Vulkan (но не ставки на спорт)

20. Python, PgSQL и Vulkan (но не ставки на спорт)

Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями!

Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc


Shownotes:

01:33 Python 3.10

08:02