python
pandas
pytrends
matplotlib
]
Aproximadamente 3.5 billones de búsquedas se realizan en Google Search diariamente, lo que significa que alrededor de 40,000 búsquedas se realizan cada segundo. Por lo tanto, Google Search es un gran caso de uso para analizar datos basados en consultas de búsqueda. Con eso en mente, analizaremos Google Search con el uso de Python.
Google no da mucho acceso a los datos sobre las consultas de búsqueda diarias, pero otra aplicación de Google conocida como Google Trends se puede utilizar para la tarea de análisis de búsqueda de Google. Google Trends proporciona una API que se puede utilizar para analizar las búsquedas diarias en Google. Esta API se conoce como pytrends
, podemos instalarla fácilmente usando el comando pip install pytrends
.
Una vez instalada la librería pytrends
en nuestro sistema, comenzamos con la tarea del análisis de Google Search importando las librerías de Python que vamos a necesitar:
in [1]: import pandas as pd
from pytrends.request import TrendReq
import matplotlib.pyplot as plt
tendencias = TrendReq()
Aquí analizamos las tendencias de búsqueda de Google en las consultas basadas en “Machine Learning”, creamos un DataFrame
de los 10 principales países que buscan “Machine Learning” en Google:
in [2]: tendencias.build_payload(kw_list=["Machine Learning"])
data = tendencias.interest_by_region()
data = data.sort_values(by="Machine Learning", ascending=False)
data = data.head(10)
print(data)
out [2]: Machine Learning
geoName
China 100
Singapore 39
St. Helena 28
India 27
Hong Kong 21
South Korea 19
Nepal 18
Pakistan 17
Israel 15
Bangladesh 15
De acuerdo con los resultados anteriores, las consultas basadas en “Machine Learning” se realizan principalmente en China. También podemos visualizar estos datos usando un gráfico de barras:
in [3]: data.reset_index().plot(x="geoName", y="Machine Learning",
figsize=(20,15), kind="bar")
plt.style.use('fivethirtyeight')
plt.xlabel('País')
plt.ylabel('Machine Learning')
plt.show()
Como sabemos, el Machine Learning ha sido el foco de muchas empresas y estudiantes durante los últimos 3-4 años. Veamos la tendencia de las consultas en Google Search basadas en “Machine Learning” para comprender cómo incrementa o disminuye.
in [4]: data = TrendReq(hl='en-US', tz=360)
data.build_payload(kw_list=['Machine Learning'])
data = data.interest_over_time()
fig, ax = plt.subplots(figsize=(20, 15))
data['Machine Learning'].plot()
plt.style.use('fivethirtyeight')
plt.title('Total búsquedas Google Search para Machine Learning', fontweight='bold')
plt.xlabel('Año')
plt.ylabel('Total Búsquedas')
plt.show()
Podemos ver como las búsquedas de Google basadas en “Machine Learning” comenzaron a aumentar en 2017 y llegaron a su punto máximo en 2020.
Así es como podemos analizar las búsquedas de Google en función de cualquier palabra clave y comprender qué buscan las personas en Google en un momento dado.
Puedes descargar el cuaderno del este projecto aquí