L’extraction web, aussi connue comme le web scraping ou moissonnage du web, est une pratique de plus en plus utilisée, en particulier dans le domaine de la veille concurrentielle et de la recherche marketing. Elle se résume à extraire des données depuis des pages web accessible publiquement pour en faire des bases de données structurées. […]
Étiquette : python
Installation de CUDA et SpaCY sur Manjaro
Dans cet article, je vais te montrer comment installer CUDA et CuDNN sur Manjaro pour les utiliser avec SpaCY. SpaCY une librairie de traitement du langage naturel pour Python basée sur les modèles d’apprentissage profond. Installation des dépendances pour Manjaro Nous allons d’abord installer quelques dépendances de base pour le système. J’ai un noyau Linux […]
Utiliser l’API de ConvertKit avec Python
Je vais aujourd’hui te présenter comment utiliser l’API de ConvertKit avec le langage de programmation Python. Je t’avertis tout de suite, leur API est en cours de développement et n’est pas aussi complète qu’on pourrait le souhaiter. Par exemple, les séquences automatisées et les actions automatiques ne sont pas encore couverts. Lorsque ces fonctionnalités seront […]
Visibilité des projets d’un groupe GitLab
Je vais te montrer comment changer la visibilité de tous les projets d’un groupe dans GitLab. Pour ce faire, nous allons utiliser le langage Python et l’API de GitLab. Groupes et visibilité des projets dans GitLab Dans GitLab, nous avons la possibilité de faire des groupes ayant une visibilité, ou permissions d’accès, différente selon nos […]
Analyse de la censure littéraire avec spaCy et Scrapy
Dans ce billet, je plonge dans l’analyse de la censure littéraire à l’aide du langage Python et des outils Scrapy et spaCy. je te partage une analyse du langage naturel effectuée sur des descriptions de livres. Ceux-ci ont tous en commun de figurer sur une liste de censure proposée par un sénateur républicain du Texas. […]
Parcours client et stratégie de données
Dans ce billet, je te partage quelques astuces pour démarrer la création de ta stratégie de données du bon pied ! Pour ce faire, nous allons nous centrer autour du parcours client. Pour créer une bonne stratégie de données, il faut tout d’abord se mettre dans la peau des clients. On doit faire le parcours […]
Analyse de données géospatiales: images Docker
Pour mes travaux en analyse de données géospatiales, j’utilise principalement trois images docker. Celles-ci sont basées sur des images populaires auxquelles j’ajoute quelques outils personnalisés. Ça faisait maintenant 6 mois que je ne les avaient pas mises à jour, alors je profite du moment pour documenter le fonctionnement de ces images. Toutes mes images sont […]
Liens markdown et titre avec Python
Mise en situation J’ai une longue liste d’URLs que je souhaite utiliser dans une page de notes sous la forme de liens Markdown. Je veux créer des liens facilement identifiables en Markdown avec Python, et pour ce faire utiliser le titre des pages d’accueil des sites web. Python pour produire les liens Markdown Je me […]
La linguistique surprenante des commentaires Facebook – 4e partie
Voici le quatrième billet d’une série portant sur l’analyse du contenu textuel de commentaires Facebook en lien avec des articles de la presse écrite. Le troisième billet peut être lu ici. Introduction Alors que le troisième billet traitait de la modélisation et de la présentation des données qui sont analysées, nous traiterons ici de la […]
La linguistique surprenante des commentaires Facebook – 3e partie
Voici le troisième billet d’une série portant sur l’analyse du contenu textuel de commentaires Facebook en lien avec des articles de la presse écrite. Le second billet peut être lu ici. Introduction Alors que le second billet traitait des entités nommées, prises de parole et relations entre les commentaires, nous parlerons ici de modélisation et […]