70 историй о статистике, которые стоит узнать

70 историй о статистике, которые стоит узнать

6 января 2024 г.

Давайте узнаем о статистике из этих 70 бесплатных историй. Они упорядочены по времени чтения, созданного на HackerNoon. Посетите /Learn Repo, чтобы найти самые читаемые истории о любой технологии.

1. Состояние Vue в 2022 году: что изменилось за последние 12 месяцев

Ознакомьтесь с последней статистикой использования Vue и узнайте, почему популярность этого фреймворка растет.

2. Более 60 % писателей уже используют искусственный интеллект в процессе написания

Hackernoon опросил читателей о том, будут ли они использовать инструменты искусственного интеллекта в процессе написания/копирайтинга. Почти 70 % поддерживают эту идею.

3. Как установить RStudio в системе WSL

Если вы используете Windows и не хотите использовать клиент RStudio на стороне Windows, этот метод отлично подойдет.

4. Каннада-MNIST: новый набор данных рукописных цифр в городе ML

TLDR:

5. Сколько дней в своей жизни вы провели в Uber?

За последние 3 года я провел 12 дней в Ubers. Прочтите это, чтобы узнать статистику Uber за все время.

6. AB-тестирование цифровых продуктов

Обзор AB-тестирования при проектировании цифровых продуктов, таких как UX, цифровая маркетинговая реклама и разработка программного обеспечения.

7. Что LinkedIn говорит нам о количестве разработчиков в мире

Есть масса статей о количестве разработчиков в мире. Но у большинства из них либо нет хорошей методологии, либо они просто заимствуют статистику из других ресурсов.

8. Рассчитайте требуемую норму прибыли с помощью трехфакторной модели Фамы-Френча

Инвесторы всегда оценивают сумму риска, которую они готовы принять ради определенной ожидаемой прибыли. Интуитивно понятно, что лучшие инвестиции максимизируют прибыль.

9. Как предсказывать новости: анализ последовательности сообщений и усиление; Цифровая интуиция

Нас могут предупредить о предстоящих событиях, происходящих преимущественно при аналогичных обстоятельствах.

10. Причинность Грейнджера: объяснение принципа причины и следствия

... в мире, полном данных, мы можем понять последствия с помощью умных методов. Познакомьтесь с причинно-следственной связью Грейнджер.

11. Как использовать приблизительную перекрестную проверку с исключением одного для построения лучших моделей

Как использовать приблизительную перекрестную проверку с исключением одного для оптимизации гиперпараметров и обнаружения выбросов для логистической регрессии и гребневой регрессии

12. Как реализовать размытие по Гауссу

Размытие по Гауссу применяется путем свертки изображения с помощью функции Гаусса. Мы возьмем функцию Гаусса и сгенерируем матрицу размером n x m.

13. Все, что вам нужно знать о стартапах YCombinator S19

Ни для кого не секрет, что YCombinator — самый успешный акселератор в мире. Они сделали более 2538 инвестиций.

14. Почему искусственный интеллект — это дисциплина, основанная на страхе

Люди боятся ИИ. Согласно исследованию Genpact:

15. Пять главных тенденций в сфере технологических стартапов в 2020 году

По данным Statista, глобальная экономика стартапов генерирует около 3 триллионов долларов. Стартапы всегда были движущей силой мирового рынка, привнося новые идеи и трансформируя привычные бизнес-системы. К сожалению, экономический кризис, связанный с Covid-19, не обошёл эту сферу стороной.

16. Стостраничная книга по машинному обучению [обзор]

Впервые я заказал книгу «Сто страниц машинного обучения» еще в мае и только сейчас заканчиваю ее. Во времена COVID это было около 10 лет назад. Как вы могли догадаться, эта книга НЕ предназначена для быстрого чтения. Недостаток легкости чтения компенсируется эффективностью. Эта книга поглощает тяжеловесные учебники по математике и выдаёт тонкий продукт не толще ширины моего смартфона. От первой страницы до 136-й автор Андрей Бурков не тратит ни слова на изложение наиболее практичных концепций машинного обучения. Вы правильно прочитали. Это БОЛЕЕ 100 страниц! Похоже, что в книге есть некоторая предвзятость. Возьми? Теперь приготовьтесь к моему стостраничному обзору книги. Шучу.

17. Что, если статистика уличной преступности совпадет со статистикой киберпреступности?

Если бы статистика уличной преступности совпадала со статистикой киберпреступности, наш мир напоминал бы Дикий Запад.

18. Шпаргалка по статистике: руководство для начинающих по вероятности и случайным событиям

Руководство для начинающих по вероятности и случайным событиям. Изучите ключевые концепции статистики и области, на которых следует сосредоточиться, чтобы успешно пройти следующее собеседование по науке о данных.

19. Ключевые статистические данные за 2022 год на рынке No-Code/Low-Code

Мы изучаем рынок low-code/no-code, который в ближайшие годы будет экспоненциально расти.

20. Размер имеет значение: глобальная контрольная группа банка

Узнайте, как правильно подходить к измерениям на основе данных. Посмотрите, какие неожиданные результаты мы получили в банке, и получите информацию для собственного анализа данных.

21. Насколько популярен правый контент на Facebook?

В прошлом Facebook подвергался критике, поскольку многие считали, что они позволяют безудержному распространению правого контента на сайте.

22. Обнаружение выбросов с помощью хи-квадрата

Это простой метод обнаружения выбросов, процедура по сути представляет собой квантиль распределения Вейбулла теста хи-квадрат в Python.

23. 3 интересных статистики NFT: как NFT внедряются во всем мире

Число владельцев NFT выросло по всему миру, причем лидируют страны Юго-Восточной Азии, такие как Филиппины, Таиланд и Малайзия.

24. Корреляция против причинно-следственной связи: почему корреляция не подразумевает причинно-следственную связь

Термины корреляция и причинно-следственная связь довольно часто путают, однако они не являются синонимами, и в этой статье указаны основные причины, почему.

25. Как создать диаграмму-воронку в R

Диаграмма воронки в R. Диаграмма воронки в основном используется для демонстрации потока пользователей в бизнес-процессе или процессе продаж.

26. Интуиция, лежащая в основе концепции «LIME» в области искусственного интеллекта и amp; МЛ

Статья-преамбула, описывающая фундаментальные принципы & интуиция, лежащая в основе концепции «LIME» в области искусственного интеллекта и amp; Машинное обучение.

27 . Hinge Loss — функция устойчивой оценки потерь для моделей классификации SVM в AI & МЛ

Исследователи используют алгебраическую методику под названием «Потери», чтобы оптимизировать пространство машинного обучения, определяемое конкретным вариантом использования.

28. Цифровые рабочие места: взлом будущего работы

Взгляд на то, как работать в будущем с помощью цифровых рабочих пространств

29. [Инфографика] Состояние диалогового ИИ в 2020 году

Диалоговый ИИ всегда был готов к взлету в 2020 году. Фактически, Gartner предсказал, что 80% компаний внедрят тот или иной диалоговый интерфейс к концу этого года. С появлением COVID-19 начался усугубляющийся рост этой категории, и я хотел показать, насколько далеко мы продвинулись. Поэтому для любителей разговорного общения я создал эту инфографику, которая дает четкое представление о том, где диалоговый ИИ находится в данный момент.

30. За пределами A/B-тестирования: группы переключения и синтетического контроля

Разработка экспериментов на рынке без AB-тестирования с использованием синтетических контрольных групп и переключателей.

31. Фактор инфляции дисперсии — подходящий статистический показатель для выявления мультиколлинеарности

32. Электронная коммерция – это торт, а не вишенка на торте

В условиях пандемии электронная коммерция резко возросла, что привело к необратимому росту онлайн-покупок.

33. Концепция «среднего целевого кодирования» в AI & МЛ

Вводная статья, описывающая концепцию & интуиция, лежащая в основе «среднего целевого кодирования» в AI&ML, его плюсы и минусы, а также реализация на примере в реальном времени.

34. Консоль № 17: японские тосты с пиццей и черепахами

12.01.2019

35. Топ-7 наиболее часто используемых веб-фреймворков среди разработчиков во всем мире в 2021 году [статистика]

Топ-7 наиболее часто используемых веб-фреймворков среди разработчиков во всем мире в 2021 году [статистика]

36. Однократный тест скорости — это весело. Сотни тестов могут оказаться более точными

Выпуск первой внутренней сборки приложений NordVPN, в которую входил NordLynx — наш новый протокол, построенный на основе WireGuard®, — стал волнующим моментом для команды. Все начали публиковать результаты своих тестов скорости в Slack и обсуждать разницу. Хотя большую часть времени NordLynx превосходил другие протоколы, в некоторых случаях результаты по скорости были немного хуже.

37. Почему я потратил годы на написание детской книги по науке о данных

Я написал детскую книгу по науке о данных, чтобы рассказать другим, кому трудно понять концепции науки о данных и машинного обучения, особенно детям!

38. Применение статистического анализа к внутридневной торговле на рынке Форекс с использованием SQL

Статистический анализ, внутридневная торговля на рынке Форекс, использование SQL

39. Дисперсия – это больше, чем просто модное словечко для статистиков

Объяснение реальных приложений и философии статистических отклонений в сфере финансов, инвестирования и азартных игр.

40. CLIP: Инновационный водопровод между компьютерным зрением и НЛП

Элементарная статья, описывающая концепцию алгоритма «CLIP» в глубоком обучении, его подход, реализацию, область применения и возможности; ограничения.

41. 👨‍🔬️ 10 лучших навыков специалиста по данным, которые нужно развивать, чтобы себя нанять

Список 10 лучших навыков Data Scientist, гарантирующих трудоустройство. А также подборка полезных ресурсов для овладения этими навыками

42. Как специалист по данным видит колоду карт

Парадокс творчества специалиста по данным

43. 12 лучших предустановленных наборов данных R, обычно используемых для статистического анализа

Программирование на R в основном используется в статистическом анализе и машинном обучении. В этой статье рассматриваются лучшие предустановленные наборы данных R, обычно используемые для статистического анализа.

44. Радиальные базисные функции: типы, преимущества и варианты использования

Вводная статья, объясняющая основы интуиции, математические идеи и т. д. область применения радиальной базисной функции в развитии прогнозного машинного обучения.

45. Используйте правило 80/20 с умеренностью

Правило 80/20, также известное как принцип Парето, было закреплено следующим образом: «80% следствий происходят от 20% причин». Различные случаи возникновения этого правила изучались в прошлом веке такими великими личностями, как Вильфредо Парето (землевладение в Италии), Джордж Кингсли Зипф (частота слов в языках) и Джозеф М. Джуран (управление качеством в промышленности). . Работая специалистом по данным, я видел достаточно случаев, когда правило 80/20 применялось на деловых встречах, сопровождавшихся аплодисментами 👏👏👏. Кроме того, я прочитал множество постов в LinkedIn. В большинстве случаев это просто безрассудное нарушение правил. Но в чем здесь опасность, если она есть? В конце концов, прибыль имеет большее значение, чем математическая и статистическая строгость.

46. Уровень вовлеченности TikTok в 2022 году составит в среднем 5,96 %

Улучшите свои стратегии в социальных сетях на 2022 год, зная самые важные перспективные маркетинговые тенденции TikTok и статистику вовлеченности.

47. Как использовать психологические приемы, чтобы оживить числа

Легко представить себе размещение 10 стульев в комнате, но сложно представить себе 1000 стульев. Чтобы получить точную систему отсчета, большинству из нас нужно начать с наброска диаграммы. Понимая это и применяя это в бизнесе, последнее, чего вы хотите, — это чтобы вашему клиенту пришлось искать ручку, бумагу и калькулятор, чтобы понять характеристики вашего продукта, основанные на цифрах — не задавайте домашнее задание. Привлеките внимание клиентов, применив эти умные способы превратить цифры в то, что волнует людей.

48. Используйте повышающую выборку и веса для решения проблемы дисбаланса данных

Работали ли вы над проблемой классификации машинного обучения в реальном мире? Если да, то у вас, вероятно, есть некоторый опыт решения проблемы дисбаланса данных. Данные о дисбалансе означают, что классы, которые мы хотим предсказать, непропорциональны. Классы, составляющие большую часть данных, называются классами большинства. Те, которые составляют меньшую часть, представляют собой классы меньшинств. Например, мы хотим использовать модели машинного обучения для выявления мошенничества с кредитными картами, а мошеннические действия происходят примерно в 0,1% из миллионов транзакций. Большинство регулярных транзакций не позволят алгоритму машинного обучения выявить закономерности мошеннических действий.

49. Почему алгоритмическая справедливость неуловима

В 2016 году Google Photos классифицировал фотографию двух афроамериканцев как «горилл». Два года спустя Google так и не сделал ничего, кроме удаления слова «гориллы» из своей классификационной базы данных. В 2016 году было показано, что Amazon непропорционально предлагает однодневную доставку европейско-американским потребителям. Во Флориде было показано, что алгоритмы, используемые для рекомендации решений о задержании и условно-досрочном освобождении на основании риска рецидива, имеют более высокий уровень ошибок среди афроамериканцев, так что афроамериканцы с большей вероятностью будут неправильно рекомендованы к задержанию, если они не будут продолжать совершить повторное преступление. При переводе с языка с гендерно-нейтральными местоимениями на языки с гендерными местоимениями нейронная сеть Google word2vec вводит в переводы гендерные стереотипы, например, местоимения становятся «он» в сочетании со словами «доктор» (или «босс», « финансист» и т. д.), но становится «она» при переводе в сочетании со словом «медсестра» (или «домохозяйка», или «няня» и т. д.).

50. Как получить статистику игрока из недокументированного REST API НХЛ

Это снова то время года. Лето подходит к концу, осень не за горами, и сезон НХЛ вот-вот начнется.

51. Важность проверки гипотез

Проверка гипотез важна для оценки ответов на вопросы, касающиеся выборок данных.

52. Обнаружение изменений в случаях COVID-19 с помощью байесовских моделей

Байесовская модель точки изменения для оценки даты, когда число новых случаев COVID-19 начнет выравниваться в разных странах.

53. 3 распределения данных для подсчетов с точки зрения непрофессионала

Подсчеты есть повсюду, поэтому независимо от вашего опыта, эти распределения данных пригодятся.

54. Как я пришел в науку о данных

Путь инженера-программиста в науку о данных в Yelp и Uber

55. Кто вообще читает HackerNoon?

Ты, очевидно. И миллионы людей со всего мира. На какую аудиторию вы размещаете рекламу? Для кого вы пишете? Узнайте больше о наших читателях здесь.

56. Цифры не лгут, но их постоянно неправильно интерпретируют

поэтому рабочий компромисс между этими двумя крайностями следует искать в каждом конкретном случае

57. Калибровка модели в машинном обучении: важная, но незаметная концепция

Вводная статья, раскрывающая концепцию калибровки модели, ее важность и использование при разработке моделей машинного обучения.

58. Понятия, лежащие в основе «обучения на основе моделей» и «обучения на основе экземпляров» в ИИ и amp; МЛ

Вступительная статья, разъясняющая фундаментальные принципы и различия между «на основе модели» и «на основе модели»; «Экземплярное» обучение в областях искусственного интеллекта и amp; Машинное обучение.

59. Случайность: значение в повседневной жизни и науке

«Это так случайно!» Общая фраза, используемая для выражения чего-то неожиданного или бессистемного. Означает ли случайность в науке что-то другое?

60. 40% американцев не знают, что влияет на их кредитный рейтинг

Кредитный рейтинг ваших клиентов — один из самых важных показателей их финансовой жизни. Это трехзначное число является наиболее часто используемой моделью кредитного скоринга кредиторами для оценки кредитоспособности заемщика или вероятности того, что он вернет деньги.

61. Понимание кластеризации волатильности Биткойна и как извлечь из этого выгоду

В 2019 году волатильность Биткойна (BTC) была нестабильной. Только за один день цена биткойна изменилась более чем на 40%. Однако в большинстве дней изменение цены колеблется в пределах 1–2%. Цель этой статьи — изучить природу волатильности BTC и посмотреть, какие стратегии лучше всего подходят для того, чтобы воспользоваться ею.

62. [Обновление для разработчиков] Hacker Noon + Google Analytics = счастливые авторы

Здесь Остин, ваш дружелюбный инженер-программист из Hacker Noon, с интересными новостями! Мы рады сообщить, что авторы теперь могут видеть просмотры страниц и общее время чтения для всех историй, опубликованных с помощью Hacker Noon с момента нашего основания в 2016 году. Насколько это круто? Раньше наша страница статистики была доступна только для недавних историй.

63. Руководство программиста по взлому кода «вдвое быстрее, вдвое быстрее»

Современные методы измерения программного обеспечения не обеспечивают прочной основы для постоянного совершенствования. Данная статья пытается восполнить этот пробел.

64. Статистика показывает, что за последние два года резко возросло внедрение искусственного интеллекта и инвестиции в него

Концепция искусственного интеллекта как нечеловеческого интеллекта зародилась в 1950-х годах, но никто тогда не мог предположить, каких успехов ИИ достигнет в 2020-е годы. Всего за 70 лет у нас появились боты, которые могут учиться, решать сложные вычислительные задачи, писать соответствующие тексты, генерировать изображения и музыку и анализировать тонны информации за секунды.

65. Решение проблемы секретаря

О чём вы думали, когда влюблялись в кого-то? Вы мечтали о браке с ним/ней? Когда у вас были серьезные отношения, планировали ли вы брак со своим партнером? Как сложились отношения? Некоторые отношения перерастают в брак, а некоторые нет. Слушая истории многих друзей, я вижу крайне мало людей, состоящих в отношениях (а затем и вступающих в брак) только с одним человеком на протяжении всей своей жизни.

66. Ключевые показатели производительности приложений с точки зрения статистика, ставшего разработчиком

Вы только что выпустили свое новое приложение в эксплуатацию и работаете в производстве. Успех! Что теперь? Твоя работа закончена, да? Неправильный. Теперь, когда вы развернули свой код, пришло время его отслеживать, собирать данные и анализировать показатели.

67. #CorrelateThis - Нейронная активность мышей указывает на колебания цен на криптовалюту

В своем исследовании Гвидо сообщил об открытии нейронов, которые показали нейронную корреляцию с колебаниями цен на основные криптовалюты!

68. Это секретное оружие фейковых новостей

Современные фейковые новости превратились в сложный организм, тщательно созданный для сокрытия своих обманных механизмов от любой потенциальной жертвы. Но хотя поле фейковых новостей превратилось во все возможные цифровые каналы, правда в том, что по своей сути, чтобы быть эффективным, оно по-прежнему опирается на эксплуатацию наших самых основных человеческих качеств.

69. Простые советы для успешного мониторинга производительности приложений

Вы наконец-то вышли в эфир, поздравляем! Что теперь?

70. Количественная оценка изменчивости: дисперсия, стандартное отклонение и коэффициент вариации

Существует множество способов количественной оценки изменчивости, однако здесь мы сосредоточимся на наиболее распространенных из них: дисперсии, стандартном отклонении и коэффициенте вариации. В области статистики мы обычно используем разные формулы при работе с данными о населении и выборочными данными.

Спасибо, что ознакомились с 70 самыми читаемыми историями о статистике на HackerNoon.

Посетите репозиторий /Learn, чтобы найти самые читаемые статьи о любой технологии.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE