8 лучших наборов данных о поведении человека для машинного обучения
23 января 2023 г.Человеческое поведение описывает, как люди ведут себя и взаимодействуют друг с другом.
Оно основано на ряде элементов, в том числе на генетических особенностях, культуре, личных ценностях и взглядах, и зависит от них.
В этой статье мы рассмотрим 8 лучших наборов данных о поведении человека для машинного обучения
Список лучших наборов данных о поведении человека
- Показатели мирового развития Всемирного банка – этот набор данных содержит информацию о ВВП, ожидаемой продолжительности жизни и уровне грамотности в различных странах мира. Он также включает множество экономических и социальных переменных.
2. Опрос американского сообщества Бюро переписи населения США – этот набор данных включает широкий спектр демографических и экономических данных, таких как данные о населении, занятости, доходах, бедности, жилье, образовании, здравоохранении, транспорте, промышленности, государственной политике и потребительских расходах. Это широко используемый набор данных для исследования демографических и экономических тенденций в США.
3. Всемирный опрос Гэллапа – этот набор данных включает данные по различным темам, связанным с благополучием и качеством жизни, в том числе данные о счастье, удовлетворенности жизнью, положительных и отрицательных эмоциях.
4. Глобальное исследование отношения исследовательского центра Pew — этот набор данных включает данные об отношении и ценностях. в странах по всему миру, включая данные о политических взглядах, социальных проблемах и других темах.
5. Система наблюдения за поведенческими факторами риска Центров США по контролю и профилактике заболеваний – Этот набор данных включает данные о поведении в США, связанном со здоровьем, в том числе данные о питании, физической активности, употреблении табака и алкоголя.
6. Набор данных по именам детей Управления социального обеспечения США — этот набор данных включает данные о популярности детских имен в Соединенных Штатах с течением времени, которые можно использовать для изучения тенденций в традициях и предпочтениях в отношении именования.
7. Обследование потребительских расходов Бюро статистики труда США – этот набор данных включает данные о потребительских расходах. в США, включая данные о том, что люди покупают и сколько тратят.
8. Национальное обследование здоровья и питания Национального института здравоохранения США — этот набор данных включает данные о здоровье и питании людей в США, включая данные о питании, физической активности и других привычках, связанных со здоровьем.
Распространенные варианты использования наборов данных о поведении человека
Экономическое и социальное развитие
Набор данных показателей мирового развития Всемирного банка – общее использование примеры этого набора данных включают:
* Изучение здоровья. Исследователи могут использовать этот набор данных для изучения ожидаемой продолжительности жизни, младенческой смертности и доступа к статистике здравоохранения в ряде разных стран.
* Сравнительное исследование стран. Используя этот набор данных, исследователи могут изучить, как разные страны развивались в экономическом и социальном плане, и определить, какие элементы способствовали одним из этих изменений, а не другим.
* Анализ гендерного равенства. Исследователи могут использовать этот набор данных для изучения информации о гендерном равенстве, включая информацию о представительстве женщин в политике, образовании и на рынке труда.
* Исследование окружающей среды: этот набор данных может использоваться исследователями для изучения информации об экологической устойчивости, включая информацию о возобновляемых источниках энергии, выбросах углерода и управлении ресурсами.
* Изучение неравенства доходов. Этот набор данных может использоваться исследователями для изучения неравенства доходов и оценки того, как доходы и богатство распределяются между странами и внутри них.
* Исследование охвата финансовыми услугами. Исследователи могут использовать этот набор данных для изучения информации о доступности финансовых услуг, включая информацию о количестве банковских счетов и наличии кредита.
* Изучение инфраструктуры: исследователи могут использовать этот набор данных для изучения информации о развитии инфраструктуры, включая информацию о сетях транспорта, связи и доступа к энергии.
* Анализ ВВП: этот набор данных может использоваться исследователями для изучения исторических темпов экономического роста и анализа статистических данных о валовом внутреннем продукте (ВВП) для разных стран.
* Анализ бедности. Используя эту информацию, исследователи могут изучить глобальные тенденции бедности, а также ее уровень и причины.
* Анализ образования. Исследователи могут использовать этот набор данных для изучения взаимосвязи между образованием и экономическим развитием, изучая уровень грамотности и образовательную статистику в разных странах.
Демографические и экономические тенденции
Набор данных опроса американского сообщества Бюро переписи населения США – распространенные случаи использования этот набор данных включает:
* Географический анализ. Исследователи могут изучать закономерности и тенденции в различных регионах США, используя этот набор данных для анализа данных на уровне штата, округа и на местном уровне.
* Данные о занятости по отраслям и профессиям могут быть проанализированы исследователями с помощью этого набора данных, который содержит данные по отраслям.
* Анализ государственной политики. Исследователи могут использовать этот набор данных для изучения информации по вопросам государственной политики, таким как социальное обеспечение, инвалидность и статус ветерана.
* Анализ бизнеса и маркетинга. Этот набор данных может использоваться исследователями, маркетологами и предприятиями для оценки данных о потребительских расходах, демографических данных и рыночных тенденциях, чтобы найти новых клиентов, целевые рынки и возможности продаж.
* Демографический анализ: исследователи могут использовать этот набор данных для изучения статистических данных о населении США, таких как размер, возраст, раса и этническая принадлежность.
* Экономический анализ: этот набор данных может использоваться исследователями для изучения экономической информации, такой как информация о занятости, доходах и бедности.
* Исследователи могут использовать этот набор данных для изучения информации о жилье, в том числе информации о единицах жилья, заполняемости и расходах на жилье.
* Анализ данных об образовании. Исследователи могут использовать этот набор данных для изучения данных, связанных с образованием, таких как статистика зачисления и успеваемости.
* Данные о здоровье, такие как информация о доступе к медицинскому обслуживанию и медицинскому страхованию, могут быть проанализированы исследователями с помощью этого набора данных.
* Исследователи могут использовать этот набор данных для оценки данных о транспорте, включая информацию о способе передвижения на работу и количестве времени, затрачиваемом на это.
Благополучие и качество жизни
Набор данных Всемирного опроса Гэллапа – Общие варианты использования этого набора данных включают:
* Сравнительное исследование стран. Исследователи могут использовать этот набор данных, чтобы сравнить благополучие и качество жизни в разных странах и определить факторы, влияющие на благополучие.
* Изучение культурных и социальных факторов. Исследователи могут использовать этот набор данных для изучения данных о культурных и социальных факторах, которые могут способствовать благополучию, и сравнивать их с данными других стран.
* Изучение экономических факторов. Исследователи могут использовать этот набор данных для изучения данных об экономических факторах и их связи с благополучием, таких как данные о доходах, гарантиях занятости и бедности.
* Изучение политических факторов. Исследователи могут использовать этот набор данных для изучения данных о политических факторах и их связи с благосостоянием, таких как данные о политической свободе, коррупции и эффективности правительства.
* Исследование субъективного благополучия. Исследователи могут использовать этот набор данных для изучения данных о субъективном благополучии, которое является показателем того, как люди оценивают свою жизнь и счастье.
* Анализ оценки жизни. Исследователи могут использовать этот набор данных для анализа данных о том, как люди оценивают свою жизнь и как она варьируется в зависимости от страны и демографической группы.
* Исследование психического здоровья. Исследователи могут использовать этот набор данных для изучения данных о психическом здоровье, депрессии и благополучии, а также сравнивать данные с другими странами.
* Исследование социальной поддержки. Исследователи могут использовать этот набор данных для изучения данных о социальной поддержке и сравнения данных с другими странами.
* Анализ счастья. Исследователи могут использовать этот набор данных для анализа данных о счастье и удовлетворенности жизнью в разных странах и изучения факторов, влияющих на благополучие.
* Изучение положительных и отрицательных эмоций. Исследователи могут использовать этот набор данных для изучения положительных и отрицательных эмоций, таких как стресс, беспокойство, удовольствие и счастье, в разных странах.
Отношения и ценности
Набор данных Global Attitudes Survey исследовательского центра Pew Research Center — распространенные варианты использования этого набора данных включают:
* Исследование политических взглядов. Исследователи могут использовать этот набор данных для изучения того, как люди в разных странах относятся к политике, политическим лидерам и политическим системам.
* Исследование социальных проблем: исследователи могут использовать этот набор данных, чтобы изучить, как люди в разных странах относятся к социальным проблемам, таким как иммиграция, права ЛГБТ и гендерное равенство.
* Изучение отношения к религии. Исследователи могут использовать этот набор данных, чтобы изучить отношение людей в разных странах к религии и их религиозным взглядам.
* Исследование экономических отношений. Исследователи могут использовать этот набор данных, чтобы изучить, как люди в разных странах относятся к экономическим темам, включая неравенство доходов, возможности трудоустройства и международную торговлю.
* Исследование отношения к Китаю. Используя эту информацию, исследователи могут изучить, как люди в других странах относятся к Китаю, включая их мнения о его политике, экономике и культуре.
* Исследование отношения к изменению климата. Исследователи могут использовать этот набор данных, чтобы изучить, как люди в разных странах относятся к экологическим проблемам и изменению климата.
* Изучение отношения к глобализации. Используя эту информацию, исследователи могут изучить, как люди в разных странах относятся к глобализации, включая их мнения о ее политических, культурных и экономических последствиях.
* Изучение международных отношений: этот набор данных может использоваться исследователями для изучения отношения людей к международным отношениям, в том числе их отношения к другим странам, иностранной помощи и международным организациям.
* Изучение отношения к США. Используя этот набор данных, исследователи могут изучить, как люди во всем мире относятся к Соединенным Штатам, в том числе их мнения о политике, культуре и внешней политике США.
* Исследование отношения к Европейскому Союзу. Используя этот набор данных, исследователи могут изучить, как люди в разных странах относятся к ЕС, включая их мнения о его институтах, политике и сотрудничестве.
Поведение, связанное со здоровьем
Набор данных Системы наблюдения за поведенческими факторами риска Центров по контролю и профилактике заболеваний США strong> — общие варианты использования этого набора данных включают:
* Анализ поведения в отношении здоровья. Исследователи могут использовать этот набор данных для анализа информации о поведении в отношении здоровья, включая информацию о мерах по укреплению здоровья, таких как иммунизация, скрининг рака и использование ремней безопасности.
* Исследование психического здоровья. Исследователи могут использовать этот набор данных для изучения информации о психическом здоровье, включая информацию о депрессии и самоубийствах.
* Исследователи и представители органов здравоохранения могут использовать этот набор данных для отслеживания изменений в рискованном поведении и результатах в отношении здоровья, а также для выявления людей, подверженных наибольшему риску определенных заболеваний или привычек.
* Изучение последствий для здоровья: с помощью этого набора данных исследователи могут изучать данные о результатах в отношении здоровья, например статистику заболеваемости и смертности, и сопоставлять их с данными на федеральном уровне, уровне штата и местном уровне.
* Сравнивая данные до и после реализации программы, исследователи могут использовать этот набор данных для оценки эффективности инициатив по укреплению здоровья и профилактике заболеваний.
* Анализ политики в области здравоохранения. Предоставляя информацию о распространенности поведения и результатах в отношении здоровья, а также определяя группы населения, которые больше всего нуждаются в вмешательстве, исследователи могут использовать этот набор данных для обоснования политики и инициатив в области общественного здравоохранения.
* Изучение факторов риска. Исследователи могут использовать этот набор данных для изучения факторов, повышающих риск развития хронических заболеваний, таких как информация о питании, физических упражнениях, употреблении сигарет и алкоголя.
* Исследование различий в состоянии здоровья: этот набор данных может использоваться исследователями для изучения информации о различиях в состоянии здоровья, например информации о привычках в отношении здоровья и результатах среди различных групп населения.
* С помощью этого набора данных исследователи могут анализировать данные о состоянии здоровья, о которых сообщают сами, например информацию о хронических заболеваниях и инвалидности.
* Изучение доступа к медицинскому обслуживанию: этот набор данных может использоваться исследователями для изучения информации о доступе к медицинскому обслуживанию, включая информацию о страховании здоровья и использовании медицинских услуг.
Набор данных национального исследования здоровья и питания Национального института здравоохранения США – распространенные случаи использования этот набор данных включает:
* Данные о воздействии на окружающую среду, такие как информация об уровне свинца, использовании пестицидов и других вредных химических веществ, могут быть изучены с помощью этого набора данных, по мнению исследователей.
* Исследование различий в состоянии здоровья: этот набор данных может использоваться исследователями для изучения информации о различиях в состоянии здоровья, например информации о привычках в отношении здоровья и результатах среди различных групп населения.
* С помощью этого набора данных исследователи могут анализировать данные о состоянии здоровья, о которых сообщают сами, например информацию о хронических заболеваниях и инвалидности.
* Изучение доступа к медицинскому обслуживанию. Исследователи могут использовать этот набор данных для изучения информации о доступе к медицинскому обслуживанию, включая информацию об использовании медицинского страхования и услуг.
* Исследование физической активности. Исследователи могут использовать этот набор данных для изучения информации об уровнях физической активности и связанных с ней последствиях для здоровья.
* Чтобы выявить группы населения, подверженные наибольшему риску определенных нарушений здоровья или привычек, исследователи и представители органов здравоохранения могут использовать эту информацию для отслеживания тенденций поведения в отношении здоровья и последствий для здоровья.
* Сравнивая данные до и после реализации программы, исследователи могут использовать этот набор данных для оценки эффективности инициатив по укреплению здоровья и профилактике заболеваний.
* Данные о потреблении пищи, уровне питательных веществ и измерениях тела — это лишь несколько примеров информации о состоянии питания, которую исследователи могут анализировать с помощью этого набора данных.
* Исследование хронических заболеваний. Исследователи могут использовать этот набор данных для поиска информации о хронических заболеваниях, таких как диабет, рак и сердечно-сосудистые заболевания.
* Анализ политики в области здравоохранения. Предоставляя информацию о распространенности поведения и результатах в отношении здоровья, а также определяя группы населения, которые больше всего нуждаются в вмешательстве, исследователи могут использовать этот набор данных для обоснования политики и инициатив в области общественного здравоохранения.
Потребительские тенденции
Набор данных исследования потребительских расходов Бюро статистики труда США – распространенные варианты использования этого набора данных включают:
* С помощью этого набора данных можно изучить данные о потребительском кредите, включая информацию об использовании кредитных карт, непогашенной задолженности и уровне просроченной задолженности.
* Исследование потребительских сбережений: этот набор данных может использоваться исследователями для изучения информации о потребительских сбережениях, включая информацию о пенсионном планировании, инвестиционных предпочтениях и нормах сбережений.
* Данные о покупке и владении транспортными средствами, бытовой техникой и другими предметами длительного пользования — это лишь несколько примеров потребительских товаров длительного пользования, которые исследователи могут анализировать с помощью этого набора данных.
* С помощью этого набора данных можно изучать данные о потребительских услугах, например информацию о расходах на здравоохранение, образование и другие услуги.
* Изучение потребительских расходов. Исследователи могут использовать этот набор данных для изучения информации о потребительских расходах, в том числе информации о том, что покупают потребители, сколько они тратят и как меняются их покупательские привычки с течением времени.
* Исследование доходов. Исследователи могут использовать этот набор данных для изучения информации о доходах, включая информацию об источниках доходов, уровнях доходов и их распределении.
* Изучение поведения потребителей. Исследователи могут использовать этот набор данных для изучения информации о поведении потребителей, например информации об их отношении, предпочтениях и процессах принятия решений.
* Данные о демографии потребителей, включая информацию о возрасте, расе, поле и уровне образования, могут быть изучены исследователями с помощью этого набора данных.
* Данные о потребительских ценах, включая информацию об инфляции и стоимости продуктов и услуг, могут быть проанализированы исследователями с помощью этого набора данных.
* Данные о потребительских расходах и доходах во время экономического роста и рецессии, а также другие данные об экономических тенденциях могут быть изучены исследователями с помощью этого набора данных.
Соглашения об именах и предпочтения
Набор данных о детских именах Управления социального обеспечения США — распространенные варианты использования этого набора данных включают:
* Анализ тенденций в отношении имен: этот набор данных может использоваться исследователями для изучения информации о тенденциях в отношении имен, включая информацию о разработке новых имен, снижении популярности существующих имен и влиянии популярной культуры на предпочтения в отношении имен.
* Изучение региональных различий: этот набор данных может использоваться исследователями для изучения информации о региональных различиях, например информации о различиях в практике присвоения имен в штатах и регионах.
* Изучение шаблонов именования: этот набор данных может использоваться исследователями для изучения шаблонов именования, в том числе моделей именования в семьях и влияния происхождения человека на решения об именовании.
* Исследование традиций именования. Исследователи могут использовать этот набор данных для изучения информации об обычаях именования, включая информацию о том, как религия, культура и этническая принадлежность влияют на решения об именовании.
* Изучение решений об именах. Исследователи могут использовать этот набор данных для изучения информации о выборе имен, включая информацию о времени и усилиях, которые родители тратят на то, чтобы назвать своих детей, и о стандартах именования.
* Изучение тенденций именования с течением времени. Исследователи могут использовать этот набор данных для изучения данных о тенденциях именования с течением времени, включая информацию о том, как со временем менялись предпочтения в именовании и как популярность определенных имен росла или падала.
* Изучение соглашений об именах. Исследователи могут использовать этот набор данных для изучения данных о соглашениях об именах, таких как данные о влиянии культурных, социальных и исторических факторов на выбор имен.
* Исследование пола и этнической принадлежности. Исследователи могут использовать этот набор данных для изучения данных о поле и этнической принадлежности, например данных о различиях в выборе имени между мальчиками и девочками и среди разных этнических групп.
* Изучение социальных и экономических факторов. Исследователи могут использовать этот набор данных для изучения данных о социальных и экономических факторах, таких как данные о влиянии социального класса, образования и рода занятий на выбор имени.
* Исследование популярных детских имен. Исследователи могут использовать этот набор данных для изучения данных о популярности детских имен, таких как данные о наиболее распространенных именах и изменениях имен с течением времени.
Заключительные мысли об этих наборах данных о поведении человека
Исследователи, политики и предприятия могут извлечь пользу из изучения поведения, поскольку это поможет им лучше понять, как ведут себя люди и как это влияет на экономику, здоровье и другие аспекты жизни общества.
Эти наборы данных также доступны для бесплатной загрузки и использования любым пользователем.
н
Оригинал