Planet Hunters X : archives ouvertes et OpenData

Comme promis dans un précédent billet, je vais poursuivre sur ce blog l'analyse de l'article référencé arXiv:1509.03622 [astro-ph.SR]  Il n'y aura aucun jugement de ma part sur le contenu scientifique cet article. Je n'ai aucun diplôme en astrophysique qui me permettrait cela. Je vais simplement le lire et traduire ce que je comprends avec mes modestes connaissances, en ajoutant des liens à la fin de ce billet. Chacun pourra donc examiner les mêmes informations, vérifier et se faire sa propre opinion.




OpenData

Les données de La mission Kepler sont disponibles pour tous (1), avec un manuel qui permet de s'y retrouver (2).

Par exemple, il est question de "Quarters 0-17" dans l'article, comme dans la base de données. Nul doute que les spécialistes de la mission Kepler savent parfaitement de quoi il s'agit. Intuitivement, je voyais cela comme des périodes d'observation. Page 36 du manuel, on a un tableau qui explique que cela correspond à des saisons : printemps 2009 (Q1), été 2009 (Q2), etc, etc...

L'article s'intéresse plus précisément aux données de Q8, Q16 et Q17. La page (1) montre que Q8 correspond à une période allant du 6 janvier au 14 mars 2011. Les deux dernières du 12 janvier au 11 mai 2013.



En cliquant sur n'importe quel dataset (par exemple 17), on obtient la courbe du flux. 


L'interface permet de "jouer" pour obtenir plus de détails, zoomer sur une zone, par exemple pour le données de Q16.


Ces données ont déjà été analysées par des algorithmes sophistiqués, mais l'article arXiv:1509.03622 [astro-ph.SR]  a pu être écrit grâce au travail complémentaire des yeux humains via le projet Planet Hunters, et plus précisément à travers les discussions. Ce projet permet d'éviter d'avoir à surfer sur les données de Kepler dans le catalogue MAST et de guider les amateurs en leur disant quel type de courbe ils doivent signaler. La simple question "que représente cette diminution de flux lumineux en Q16 et Q17 ?" donne son titre à l'article : "Où est le flux ?".

Archive ouverte


L'article arXiv:1509.03622 [astro-ph.SR]  a été publié sur une archive ouverte, c'est-à-dire qu'il n'est pas nécessaire de payer pour le lire (3). Cette version, ou "preprint" est comparable au devoir que rend l'étudiant à son professeur. Même s'il est excellent, il y a sans doute des petits trucs qui feront que la copie vaudra 18/20 et pas 20/20 : légende pas assez précise, passage trop long, paragraphe pas clair, etc... Si un autre étudiant à un devoir similaire à rendre, la version"preprint" lui suffira largement. Il ne l'a recopiera pas, mais la mentionnera à la fin de son propre devoir (comme je le fais dans ce billet).

Rendre les données de la science accessibles à tout citoyen est un enjeu majeur ! En France, nous avons HAL (4), qui permet à celui qui paye les chercheurs via ses impôts d'accéder aux résultats de ladite recherche. Malheureusement, tout n'est pas si simple, comme en témoigne ce billet récent écrit par un maître de conférence. (5)

L'article arXiv:1509.03622 [astro-ph.SR]  a rassemblé les courbes "roses" (PDCSAP_FLUX) sur les 4 ans d'observation. J'ai surligné en orange ce qui correspond à Q8 et en vert à Q16-Q17.



L'intérêt d'avoir le jeu de données mis en ligne gratuitement est de permettre à l'expert comme à l'amateur de vérifier qu'il n'y a pas eu de modifications. S'il y a des erreurs, elles viennent des instruments de Kepler, pas des logiciels utilisés par les auteurs de l'article.

Une fois que l'on a sous la main, les données et l'article, "yapluka" essayer d'expliquer tout cela...

À suivre...



3- Le résumé de l'article, ses meta-données (date de soumission, versions...), une version pdf, sont disponibles ici : http://arxiv.org/abs/1509.03622 


5- Les présidents d'université, les données de la science, le bien commun et le bal des faux-culs.



Commentaires