Une démarche statistique et démographique sur le COVID-19

published on

En 2020, il nous aura été possible de suivre en temps réel le nombre de morts du COVID-19. Une sacrée performance technologique pour le macabre qui, dans la logique de l'open data, permet à ceux qui le souhaitent de tâter un peu du chiffre létal.

Il se trouve que les bases de données, j'en ai manipulées pas mal. Des catalogues de produits bio, des destinations touristiques responsables et des à-côtés personnels souvent prétexte pour prouver que tout est "crawlable".

Méthode

  • D'abord j'importe les zip fournis par l'INSEE
  • Comme certains sont assez gros, je "split" les .csv avec un script php fait maison.
  • Un autre script fait maison me permet  de copier les lignes du csv dans ma base de données SQL.
  • Ma table actuellement fait 8 millions de lignes. J'ai importé toutes les années 70, et 80 et donc 2015-2020
  • Je passe un autre script pour extraire les totaux par mois.

Et ensuite je travaille sous LibreOffice Calc. Je pourrais tout faire avec php et la librairie highchart.js mais je suis encore dans le défrichage.