Интерпретация визуализаций данных о почве и погодных API
31 мая 2022 г.Графическая визуализация данных о погоде так же важна, как и сам набор данных. Что возглавляет этот список, так это способность интерпретировать данные в разборчивом формате. Следовательно, графические визуализации, которые помогают заинтересованным сторонам понять данные о погоде, жизненно важны для любого поставщика услуг данных и лиц, принимающих решения.
На самом деле процесс получения точных, гиперлокальных данных о погоде и представления их в понятной форме воспринимается как сложный и технический. Вот почему мы работали над этим блогом, чтобы показать вам, насколько прост этот процесс.
Используемые здесь агропогодные данные получены из проверенного источника, и визуализация имеет отношение к этому конкретному региону. Понимая этот процесс в деталях, политики или заинтересованные стороны могут избежать любого наивного подхода к визуализации наборов данных, неправильной интерпретации и недоверия.
Этот блог в основном создан для понимания некоторых визуальных графиков и диаграмм, а также методов использования данных. Он направлен на то, чтобы помочь зрителям понять визуализацию и принять обоснованное решение.
Я предпочитаю использовать библиотеки Python для создания визуализаций, так как он имеет множество встроенных библиотек. Код в этом блоге написан и выполняется на блокноте Jupyter. Все, что вам нужно сделать, это загрузить блокнот Jupyter в свою систему и загрузить библиотеки Python.
```javascript
!pip установить сиборн
!pip установить matplotlib
Еще одна среда, которую я использую для запуска кодов/скриптов визуализации, — Google Colab. Это обеспечивает онлайн-среду, связанную с вашей учетной записью Google, и использует серверы Google, поэтому нет необходимости использовать ресурсы локальной системы.
Гистограмма
Гистограммы представляют собой значение конкретной величины, обозначенной высотой каждого прямоугольника. Это хороший выбор, чтобы изобразить количественные переменные в сравнении с другой переменной, чтобы провести сравнение с ними.
```javascript
sns.barplot(x="label",y='дождь', data=df, ci=нет)
plt.title("Связь урожая с осадками", fontsize = 24)
plt.xticks (поворот = 90, размер шрифта = 14)
plt.yticks (поворот = 0, размер шрифта = 14)
plt.savefig('Связь культур со значением pH.png')
Здесь отчетливо видно, что рис является культурой, требующей исключительно большого количества осадков, около 280 мм.
Гистограмма — это визуальное представление одного атрибута по отношению к другому.
График "Коробка с усами"
Как следует из названия, график Box and Whisker состоит из прямоугольника, соединенного с двумя усами. Нижняя граница «уса» — «минимум», а верхняя граница прямоугольника — «максимум». Левая сторона прямоугольника считается «нижним квартилем», а правая сторона прямоугольника указывает верхний предел предел. Центр коробки — это «медиана».
```javascript
sns.boxplot(y='метка',x='ph',данные=df)
plt.title('Подходящее значение рН почвы')
plt.savefig('Ph.png')
Этот вид визуализации предназначен для того, чтобы с первого взгляда определить, где находится большинство значений данных. Простыми словами, он обозначает диапазон значений, в пределах которого находится значение признака (столбца). Кофе, джут, арбуз, мускусная дыня и бобы мунг растут в почве со значениями pH в диапазоне от 6 до 7. Мы также можем понять, что мотыльковые бобы могут расти практически при любом уровне pH почвы.
Тепловая карта
Тепловая карта — самый важный график, используемый учеными данных. Он использует цветные обозначения для обозначения корреляции объекта с другими столбцами в наборе данных.
Корреляция показывает, насколько линейно одна функция связана с другой. С точки зрения непрофессионала, он показывает, как одна функция изменяется в зависимости от изменения другой функции.
```javascript
sns.heatmap(df.corr(),annot=True)
plt.title('Корреляционная матрица')
plt.savefig('Корреляция.png')
Более высокое значение означает большую корреляцию между объектами. «annot» — это параметр, передаваемый для отображения значений корреляции на графике, когда он установлен в значение «Истина».
Мы можем смешивать и сопоставлять условия, пока не получим ценные выводы.
Линейный график
Линейные графики — это простые интуитивно понятные визуальные элементы, которые отображают числовые значения с одной стороны и категориальные значения (группы, обозначенные метками) с другой. Этот график — лучший вариант для отображения взаимосвязи между объектами в наборе данных.
```javascript
sns.lineplot(data = df[(df['влажность']<65)], x = "K", y = "осадки", hue="label")
plt.title('Влажность ниже 65 и уровень фосфора от 15 до 25 - хорошие условия для 6 культур')
plt.savefig('Условия обрезки.png')
Когда мы проверяем культуры, которые хорошо растут при погодных условиях, таких как влажность < 65% и уровень фосфора в почве в пределах 15-25, эти условия подходят для большинства культур, таких как чечевица, мотыльковые бобы, фасоль, голубиная фасоль. бобы и кофе.
Реляционные графики (повторное построение)
Эти графики подходят для представления подмножеств (оттенков) объекта и его статистической связи с другими объектами в наборе данных. Непосредственно сравнивая взаимосвязь между культурами и основными питательными веществами, такими как азот, калий и фосфор, мы можем дать рекомендации по выращиванию определенных культур на соответствующих богатых питательными веществами почвах.
```javascript
sns.relplot(x="температура", y="N", оттенок="метка", стиль="метка",данные=df)
Вывод, который может показаться очевидным, заключается в том, что для выращивания определенного типа сельскохозяйственных культур требуются одинаковые условия. Это позволяет легко классифицировать новую культуру в зависимости от условий.
Например, мускусная дыня растет при температуре от 25 до 30 градусов по Цельсию и хорошо растет в почве с довольно высоким содержанием азота (80-120).
Вывод
Когда дело доходит до визуализации данных о погоде и почве, важно различать подходы, которые рассматривают данные объективно, и те, которые передают конкретные сведения о погоде и ее изменчивости. Чаще всего возникают некоторые противоречия, связанные с визуализацией и аналитикой данных. Это связано с тем фактом, который поднимает вопрос о том, был ли перевод данных беспристрастным и полезным для пользователей, которые хотят извлечь из него информацию, связанную с изменением климата или плодородием почвы.
В этом блоге я подробно рассказал о том, как я предпочитаю делать визуализации и интерпретировать данные. Этот метод является одним из нескольких способов визуализации для интерпретации любого набора данных. Источником данных, который я использовал в этой статье, является объединение данных о почве из ICAR — Индийского института сельскохозяйственных исследований и данных о погоде (осадки, влажность и осадки), полученных с помощью [Ambee Weather API] (https://www. getambee.com/api/weather). Это довольно ручные способы сделать это, но такие инструменты, как smartfarmingdata от Ambee, предоставляют подробные графики и другие параметры визуализации, которые я использовал здесь.
Но, в конце концов, визуализация данных неизбежна и является основой исследований и бизнес-операций. Как цитирует Эдвард Тафте, «прежде всего покажите данные» (Tufte, 1983), мы хотели бы добавить и показать его с различными стилями визуализации, атрибутами и методами, настроенными для определенного набора пользователей.
Оригинал