8 лучших наборов данных о поведении человека для машинного обучения

8 лучших наборов данных о поведении человека для машинного обучения

23 января 2023 г.

Человеческое поведение описывает, как люди ведут себя и взаимодействуют друг с другом.

Оно основано на ряде элементов, в том числе на генетических особенностях, культуре, личных ценностях и взглядах, и зависит от них.

В этой статье мы рассмотрим 8 лучших наборов данных о поведении человека для машинного обучения

Список лучших наборов данных о поведении человека

  1. Показатели мирового развития Всемирного банка – этот набор данных содержит информацию о ВВП, ожидаемой продолжительности жизни и уровне грамотности в различных странах мира. Он также включает множество экономических и социальных переменных.

2. Опрос американского сообщества Бюро переписи населения США – этот набор данных включает широкий спектр демографических и экономических данных, таких как данные о населении, занятости, доходах, бедности, жилье, образовании, здравоохранении, транспорте, промышленности, государственной политике и потребительских расходах. Это широко используемый набор данных для исследования демографических и экономических тенденций в США.

3. Всемирный опрос Гэллапа – этот набор данных включает данные по различным темам, связанным с благополучием и качеством жизни, в том числе данные о счастье, удовлетворенности жизнью, положительных и отрицательных эмоциях.

4. Глобальное исследование отношения исследовательского центра Pew — этот набор данных включает данные об отношении и ценностях. в странах по всему миру, включая данные о политических взглядах, социальных проблемах и других темах.

5. Система наблюдения за поведенческими факторами риска Центров США по контролю и профилактике заболеваний – Этот набор данных включает данные о поведении в США, связанном со здоровьем, в том числе данные о питании, физической активности, употреблении табака и алкоголя.

6. Набор данных по именам детей Управления социального обеспечения США — этот набор данных включает данные о популярности детских имен в Соединенных Штатах с течением времени, которые можно использовать для изучения тенденций в традициях и предпочтениях в отношении именования.

7. Обследование потребительских расходов Бюро статистики труда США – этот набор данных включает данные о потребительских расходах. в США, включая данные о том, что люди покупают и сколько тратят.

8. Национальное обследование здоровья и питания Национального института здравоохранения США — этот набор данных включает данные о здоровье и питании людей в США, включая данные о питании, физической активности и других привычках, связанных со здоровьем.

Распространенные варианты использования наборов данных о поведении человека

Экономическое и социальное развитие

Набор данных показателей мирового развития Всемирного банка – общее использование примеры этого набора данных включают:

* Изучение здоровья. Исследователи могут использовать этот набор данных для изучения ожидаемой продолжительности жизни, младенческой смертности и доступа к статистике здравоохранения в ряде разных стран.

* Сравнительное исследование стран. Используя этот набор данных, исследователи могут изучить, как разные страны развивались в экономическом и социальном плане, и определить, какие элементы способствовали одним из этих изменений, а не другим.

* Анализ гендерного равенства. Исследователи могут использовать этот набор данных для изучения информации о гендерном равенстве, включая информацию о представительстве женщин в политике, образовании и на рынке труда.

* Исследование окружающей среды: этот набор данных может использоваться исследователями для изучения информации об экологической устойчивости, включая информацию о возобновляемых источниках энергии, выбросах углерода и управлении ресурсами.

* Изучение неравенства доходов. Этот набор данных может использоваться исследователями для изучения неравенства доходов и оценки того, как доходы и богатство распределяются между странами и внутри них.

* Исследование охвата финансовыми услугами. Исследователи могут использовать этот набор данных для изучения информации о доступности финансовых услуг, включая информацию о количестве банковских счетов и наличии кредита.

* Изучение инфраструктуры: исследователи могут использовать этот набор данных для изучения информации о развитии инфраструктуры, включая информацию о сетях транспорта, связи и доступа к энергии.

* Анализ ВВП: этот набор данных может использоваться исследователями для изучения исторических темпов экономического роста и анализа статистических данных о валовом внутреннем продукте (ВВП) для разных стран.

* Анализ бедности. Используя эту информацию, исследователи могут изучить глобальные тенденции бедности, а также ее уровень и причины.

* Анализ образования. Исследователи могут использовать этот набор данных для изучения взаимосвязи между образованием и экономическим развитием, изучая уровень грамотности и образовательную статистику в разных странах.

Демографические и экономические тенденции

Набор данных опроса американского сообщества Бюро переписи населения США – распространенные случаи использования этот набор данных включает:

* Географический анализ. Исследователи могут изучать закономерности и тенденции в различных регионах США, используя этот набор данных для анализа данных на уровне штата, округа и на местном уровне.

* Данные о занятости по отраслям и профессиям могут быть проанализированы исследователями с помощью этого набора данных, который содержит данные по отраслям.

* Анализ государственной политики. Исследователи могут использовать этот набор данных для изучения информации по вопросам государственной политики, таким как социальное обеспечение, инвалидность и статус ветерана.

* Анализ бизнеса и маркетинга. Этот набор данных может использоваться исследователями, маркетологами и предприятиями для оценки данных о потребительских расходах, демографических данных и рыночных тенденциях, чтобы найти новых клиентов, целевые рынки и возможности продаж.

* Демографический анализ: исследователи могут использовать этот набор данных для изучения статистических данных о населении США, таких как размер, возраст, раса и этническая принадлежность.

* Экономический анализ: этот набор данных может использоваться исследователями для изучения экономической информации, такой как информация о занятости, доходах и бедности.

* Исследователи могут использовать этот набор данных для изучения информации о жилье, в том числе информации о единицах жилья, заполняемости и расходах на жилье.

* Анализ данных об образовании. Исследователи могут использовать этот набор данных для изучения данных, связанных с образованием, таких как статистика зачисления и успеваемости.

* Данные о здоровье, такие как информация о доступе к медицинскому обслуживанию и медицинскому страхованию, могут быть проанализированы исследователями с помощью этого набора данных.

* Исследователи могут использовать этот набор данных для оценки данных о транспорте, включая информацию о способе передвижения на работу и количестве времени, затрачиваемом на это.

Благополучие и качество жизни

Набор данных Всемирного опроса Гэллапа – Общие варианты использования этого набора данных включают:

* Сравнительное исследование стран. Исследователи могут использовать этот набор данных, чтобы сравнить благополучие и качество жизни в разных странах и определить факторы, влияющие на благополучие.

* Изучение культурных и социальных факторов. Исследователи могут использовать этот набор данных для изучения данных о культурных и социальных факторах, которые могут способствовать благополучию, и сравнивать их с данными других стран.

* Изучение экономических факторов. Исследователи могут использовать этот набор данных для изучения данных об экономических факторах и их связи с благополучием, таких как данные о доходах, гарантиях занятости и бедности.

* Изучение политических факторов. Исследователи могут использовать этот набор данных для изучения данных о политических факторах и их связи с благосостоянием, таких как данные о политической свободе, коррупции и эффективности правительства.

* Исследование субъективного благополучия. Исследователи могут использовать этот набор данных для изучения данных о субъективном благополучии, которое является показателем того, как люди оценивают свою жизнь и счастье.

* Анализ оценки жизни. Исследователи могут использовать этот набор данных для анализа данных о том, как люди оценивают свою жизнь и как она варьируется в зависимости от страны и демографической группы.

* Исследование психического здоровья. Исследователи могут использовать этот набор данных для изучения данных о психическом здоровье, депрессии и благополучии, а также сравнивать данные с другими странами.

* Исследование социальной поддержки. Исследователи могут использовать этот набор данных для изучения данных о социальной поддержке и сравнения данных с другими странами.

* Анализ счастья. Исследователи могут использовать этот набор данных для анализа данных о счастье и удовлетворенности жизнью в разных странах и изучения факторов, влияющих на благополучие.

* Изучение положительных и отрицательных эмоций. Исследователи могут использовать этот набор данных для изучения положительных и отрицательных эмоций, таких как стресс, беспокойство, удовольствие и счастье, в разных странах.

Отношения и ценности

Набор данных Global Attitudes Survey исследовательского центра Pew Research Center — распространенные варианты использования этого набора данных включают:

* Исследование политических взглядов. Исследователи могут использовать этот набор данных для изучения того, как люди в разных странах относятся к политике, политическим лидерам и политическим системам.

* Исследование социальных проблем: исследователи могут использовать этот набор данных, чтобы изучить, как люди в разных странах относятся к социальным проблемам, таким как иммиграция, права ЛГБТ и гендерное равенство.

* Изучение отношения к религии. Исследователи могут использовать этот набор данных, чтобы изучить отношение людей в разных странах к религии и их религиозным взглядам.

* Исследование экономических отношений. Исследователи могут использовать этот набор данных, чтобы изучить, как люди в разных странах относятся к экономическим темам, включая неравенство доходов, возможности трудоустройства и международную торговлю.

* Исследование отношения к Китаю. Используя эту информацию, исследователи могут изучить, как люди в других странах относятся к Китаю, включая их мнения о его политике, экономике и культуре.

* Исследование отношения к изменению климата. Исследователи могут использовать этот набор данных, чтобы изучить, как люди в разных странах относятся к экологическим проблемам и изменению климата.

* Изучение отношения к глобализации. Используя эту информацию, исследователи могут изучить, как люди в разных странах относятся к глобализации, включая их мнения о ее политических, культурных и экономических последствиях.

* Изучение международных отношений: этот набор данных может использоваться исследователями для изучения отношения людей к международным отношениям, в том числе их отношения к другим странам, иностранной помощи и международным организациям.

* Изучение отношения к США. Используя этот набор данных, исследователи могут изучить, как люди во всем мире относятся к Соединенным Штатам, в том числе их мнения о политике, культуре и внешней политике США.

* Исследование отношения к Европейскому Союзу. Используя этот набор данных, исследователи могут изучить, как люди в разных странах относятся к ЕС, включая их мнения о его институтах, политике и сотрудничестве.

Поведение, связанное со здоровьем

Набор данных Системы наблюдения за поведенческими факторами риска Центров по контролю и профилактике заболеваний США — общие варианты использования этого набора данных включают:

* Анализ поведения в отношении здоровья. Исследователи могут использовать этот набор данных для анализа информации о поведении в отношении здоровья, включая информацию о мерах по укреплению здоровья, таких как иммунизация, скрининг рака и использование ремней безопасности.

* Исследование психического здоровья. Исследователи могут использовать этот набор данных для изучения информации о психическом здоровье, включая информацию о депрессии и самоубийствах.

* Исследователи и представители органов здравоохранения могут использовать этот набор данных для отслеживания изменений в рискованном поведении и результатах в отношении здоровья, а также для выявления людей, подверженных наибольшему риску определенных заболеваний или привычек.

* Изучение последствий для здоровья: с помощью этого набора данных исследователи могут изучать данные о результатах в отношении здоровья, например статистику заболеваемости и смертности, и сопоставлять их с данными на федеральном уровне, уровне штата и местном уровне.

* Сравнивая данные до и после реализации программы, исследователи могут использовать этот набор данных для оценки эффективности инициатив по укреплению здоровья и профилактике заболеваний.

* Анализ политики в области здравоохранения. Предоставляя информацию о распространенности поведения и результатах в отношении здоровья, а также определяя группы населения, которые больше всего нуждаются в вмешательстве, исследователи могут использовать этот набор данных для обоснования политики и инициатив в области общественного здравоохранения.

* Изучение факторов риска. Исследователи могут использовать этот набор данных для изучения факторов, повышающих риск развития хронических заболеваний, таких как информация о питании, физических упражнениях, употреблении сигарет и алкоголя.

* Исследование различий в состоянии здоровья: этот набор данных может использоваться исследователями для изучения информации о различиях в состоянии здоровья, например информации о привычках в отношении здоровья и результатах среди различных групп населения.

* С помощью этого набора данных исследователи могут анализировать данные о состоянии здоровья, о которых сообщают сами, например информацию о хронических заболеваниях и инвалидности.

* Изучение доступа к медицинскому обслуживанию: этот набор данных может использоваться исследователями для изучения информации о доступе к медицинскому обслуживанию, включая информацию о страховании здоровья и использовании медицинских услуг.

Набор данных национального исследования здоровья и питания Национального института здравоохранения США – распространенные случаи использования этот набор данных включает:

* Данные о воздействии на окружающую среду, такие как информация об уровне свинца, использовании пестицидов и других вредных химических веществ, могут быть изучены с помощью этого набора данных, по мнению исследователей.

* Исследование различий в состоянии здоровья: этот набор данных может использоваться исследователями для изучения информации о различиях в состоянии здоровья, например информации о привычках в отношении здоровья и результатах среди различных групп населения.

* С помощью этого набора данных исследователи могут анализировать данные о состоянии здоровья, о которых сообщают сами, например информацию о хронических заболеваниях и инвалидности.

* Изучение доступа к медицинскому обслуживанию. Исследователи могут использовать этот набор данных для изучения информации о доступе к медицинскому обслуживанию, включая информацию об использовании медицинского страхования и услуг.

* Исследование физической активности. Исследователи могут использовать этот набор данных для изучения информации об уровнях физической активности и связанных с ней последствиях для здоровья.

* Чтобы выявить группы населения, подверженные наибольшему риску определенных нарушений здоровья или привычек, исследователи и представители органов здравоохранения могут использовать эту информацию для отслеживания тенденций поведения в отношении здоровья и последствий для здоровья.

* Сравнивая данные до и после реализации программы, исследователи могут использовать этот набор данных для оценки эффективности инициатив по укреплению здоровья и профилактике заболеваний.

* Данные о потреблении пищи, уровне питательных веществ и измерениях тела — это лишь несколько примеров информации о состоянии питания, которую исследователи могут анализировать с помощью этого набора данных.

* Исследование хронических заболеваний. Исследователи могут использовать этот набор данных для поиска информации о хронических заболеваниях, таких как диабет, рак и сердечно-сосудистые заболевания.

* Анализ политики в области здравоохранения. Предоставляя информацию о распространенности поведения и результатах в отношении здоровья, а также определяя группы населения, которые больше всего нуждаются в вмешательстве, исследователи могут использовать этот набор данных для обоснования политики и инициатив в области общественного здравоохранения.

Потребительские тенденции

Набор данных исследования потребительских расходов Бюро статистики труда США – распространенные варианты использования этого набора данных включают:

* С помощью этого набора данных можно изучить данные о потребительском кредите, включая информацию об использовании кредитных карт, непогашенной задолженности и уровне просроченной задолженности.

* Исследование потребительских сбережений: этот набор данных может использоваться исследователями для изучения информации о потребительских сбережениях, включая информацию о пенсионном планировании, инвестиционных предпочтениях и нормах сбережений.

* Данные о покупке и владении транспортными средствами, бытовой техникой и другими предметами длительного пользования — это лишь несколько примеров потребительских товаров длительного пользования, которые исследователи могут анализировать с помощью этого набора данных.

* С помощью этого набора данных можно изучать данные о потребительских услугах, например информацию о расходах на здравоохранение, образование и другие услуги.

* Изучение потребительских расходов. Исследователи могут использовать этот набор данных для изучения информации о потребительских расходах, в том числе информации о том, что покупают потребители, сколько они тратят и как меняются их покупательские привычки с течением времени.

* Исследование доходов. Исследователи могут использовать этот набор данных для изучения информации о доходах, включая информацию об источниках доходов, уровнях доходов и их распределении.

* Изучение поведения потребителей. Исследователи могут использовать этот набор данных для изучения информации о поведении потребителей, например информации об их отношении, предпочтениях и процессах принятия решений.

* Данные о демографии потребителей, включая информацию о возрасте, расе, поле и уровне образования, могут быть изучены исследователями с помощью этого набора данных.

* Данные о потребительских ценах, включая информацию об инфляции и стоимости продуктов и услуг, могут быть проанализированы исследователями с помощью этого набора данных.

* Данные о потребительских расходах и доходах во время экономического роста и рецессии, а также другие данные об экономических тенденциях могут быть изучены исследователями с помощью этого набора данных.

Соглашения об именах и предпочтения

Набор данных о детских именах Управления социального обеспечения США — распространенные варианты использования этого набора данных включают:

* Анализ тенденций в отношении имен: этот набор данных может использоваться исследователями для изучения информации о тенденциях в отношении имен, включая информацию о разработке новых имен, снижении популярности существующих имен и влиянии популярной культуры на предпочтения в отношении имен.

* Изучение региональных различий: этот набор данных может использоваться исследователями для изучения информации о региональных различиях, например информации о различиях в практике присвоения имен в штатах и ​​регионах.

* Изучение шаблонов именования: этот набор данных может использоваться исследователями для изучения шаблонов именования, в том числе моделей именования в семьях и влияния происхождения человека на решения об именовании.

* Исследование традиций именования. Исследователи могут использовать этот набор данных для изучения информации об обычаях именования, включая информацию о том, как религия, культура и этническая принадлежность влияют на решения об именовании.

* Изучение решений об именах. Исследователи могут использовать этот набор данных для изучения информации о выборе имен, включая информацию о времени и усилиях, которые родители тратят на то, чтобы назвать своих детей, и о стандартах именования.

* Изучение тенденций именования с течением времени. Исследователи могут использовать этот набор данных для изучения данных о тенденциях именования с течением времени, включая информацию о том, как со временем менялись предпочтения в именовании и как популярность определенных имен росла или падала.

* Изучение соглашений об именах. Исследователи могут использовать этот набор данных для изучения данных о соглашениях об именах, таких как данные о влиянии культурных, социальных и исторических факторов на выбор имен.

* Исследование пола и этнической принадлежности. Исследователи могут использовать этот набор данных для изучения данных о поле и этнической принадлежности, например данных о различиях в выборе имени между мальчиками и девочками и среди разных этнических групп.

* Изучение социальных и экономических факторов. Исследователи могут использовать этот набор данных для изучения данных о социальных и экономических факторах, таких как данные о влиянии социального класса, образования и рода занятий на выбор имени.

* Исследование популярных детских имен. Исследователи могут использовать этот набор данных для изучения данных о популярности детских имен, таких как данные о наиболее распространенных именах и изменениях имен с течением времени.

Заключительные мысли об этих наборах данных о поведении человека

Исследователи, политики и предприятия могут извлечь пользу из изучения поведения, поскольку это поможет им лучше понять, как ведут себя люди и как это влияет на экономику, здоровье и другие аспекты жизни общества.

Эти наборы данных также доступны для бесплатной загрузки и использования любым пользователем.

н


Оригинал