Annonce

Réduire
Aucune annonce.

Big data

Réduire
X
 
  • Filtre
  • Heure
  • Afficher
Tout nettoyer
nouveaux messages

    Big data

    Si vous ne comprenez pas bien à quoi peuvent servir les Big data voici un exemple concret.

    Suite à une rupture d'approvisionnement en vaccins, les nourrissons français né en 2015 vont être massivement vaccinés contre l'hépatite B. En effet, les vaccins les plus utilisés habituellement (pentavalents) protègent contre 5 maladies (Polio, Tétanos, Diphtérie, Coqueluche, Haemophilus). Leur rupture sera durable, et les médecins sont invités à utiliser un autre vaccin qui protège en sus contre l'hépatite B (vaccins hexavalents).

    Une analyse multivariée des pathologies présentées par la totalité des nourrissons sur plusieurs années est possible à partir des bases de données de l'assurance maladie et des outils informatiques modernes.

    Il ne s'agit pas bien sûr de comparer les enfants vaccinés contre l'hépatite B aux autres, ce qui n'aurait aucun intérêt du fait de biais de sélection.

    Il s'agit de voir si une ou plusieurs pathologies présentent un pic dans la cohorte des enfants nés pendant la rupture d'approvisionnement du vaccin pentavalent. Un tel pic, même s'il ne permettrait pas d'affirmer une relation de cause à effet, orienterait vers un problème lié spécifiquement au vaccin hexavalent, puisque ce vaccin aura été beaucoup plus souvent utilisé dans cette cohorte.

    De même, du fait de la puissance d'une telle comparaison (à cause de la taille des effectifs étudiés), une absence de pic dans les années suivant la vaccination permettrait de rassurer les parents qui craignent cette vaccination, en prouvant que le risque d'effet secondaire grave, s'il existe, est infinitésimal.

    Il existe quand même des biais (à vous de jouer dans les commentaires) car rien n'est jamais parfait.

    Voici comment les Big data, associées à des facteurs de rupture involontaires, permettraient de faire avancer la science.

    Accessoirement, le coût d'une telle étude est très faible.
    Dernière modification par d_dupagne, 21/03/2015, 10h31.

    #2
    Re : Big data

    Bonsoir Dominique,

    Le Big data.

    D'abord le "Cloud" nom qui inonde l'actualité technologique, les positionnements stratégiques divers. Qui n'est en fait que un modele client serveur, un stockage dans le réseau, ce qui existe depuis bien longtemps.

    Maintenant le "big data", qui lui aussi inonde l'actualité. Qui n'est que un concept de base de donnée, et d'analyses de données, de statistiques, etc... ce qui existe depuis bien longtemps.

    Pour ce qui est du Big data, ce qui change, ce n'est pas la technologie, ou l'arrivée d'un nouveau concept, c'est ce qu'on en fait, et les données qu'on utilise.
    juste plus de données, de plus en plus.
    Quant aux utilisations, pas de problèmes pour moi d'en faire des analyses pour du progrès.

    Le problème quand on parle de big data, ce n'est bien sur pas la détection de réaction à des vaccins, comme vous le décrivez.
    Moi, quand je pense à Big Data, c'est en général à des fins pas bien glorieuses.
    Les partis politiques par ex., pour optimiser leur future campagne.
    Ou bien facebook, pour tracer les "like" ou posts des personnes, pour les vendre aux sociétés clients.
    Ces 2 exemples existent déjà.

    Malheureusement, l'usage du Big Data, du fait des données à dispositions et de plus en plus à l'avenir, nous réservera des surprises bien désagréables. Meme si on s'y habituera.

    Ce que je n'aime pas dans le Big Data, c'est plusieurs choses, et la liste n'est pas exhaustive:
    - qu'on utilise des informations me concernant sans que j'ai donné mon aval.
    - qu'on en fasse des usages nominatifs, et non anonymes.
    - qu'on crée des besoins dont nous serons dépendants, sans de ce fait avoir le choix de s'en libérer.
    - que cela crée une dynamique, une frénésie liée à la connaissance de l'autre, à des fins d'exploitation.
    - que l'individu ne soit plus considéré comme tel, mais comme informations valables et utiles qu'il peut émettre.

    Ce que je peux aimer, c'est:
    - l'exemple que vous donnez
    - d'autres exemples utiles, par ex. l'adaptation des feux rouges pur la circulation, en fonction du traffic.
    - une meilleure connaissance des personnes, pour mieux comprendre la réalité (soyons rêveurs).

    Pour résumer en une phrase, je dirais que tant que l'usage est anonyme, ça va à peu près (et encore, quand vous regardez la loi de Valls, on sera en mesure par ex. de tracer légalement tous les kurdes de france, ou bien de détecter tous les numéros de téléphones de personnes habitant dans ce quartier, ou encore tous ceux qui sont roux, besoin qui arrivera car on aura détecté que les roux euh...ont un gene particulier utile pour le cancer. Que sait on des gouvernements qui arriveront à l'avenir, et des usages qu'ils feront d'une telle loi par ex., qui reposera sur le big data ?

    Bref, comme tout ce qui est moderne, comme toute avancée, inutile de freiner des 4 fers en l'air.
    Respirons un bon coup, et surfons sur les vagues, sans résistance, car ce sera énergie perdue.
    Et adaptons nous.

    Commentaire


      #3
      Re : Big data

      Envoyé par d_dupagne
      Si vous ne comprenez pas bien à quoi peuvent servir les Big data voici un exemple concret.

      Suite à une rupture d'approvisionnement en vaccins, les nourrissons français né en 2015 vont être massivement vaccinés contre l'hépatite B. En effet, les vaccins les plus utilisés habituellement (pentavalents) protègent contre 5 maladies (Polio, Tétanos, Diphtérie, Coqueluche, Haemophilus). Leur rupture sera durable, et les médecins sont invités à utiliser un autre vaccin qui protège en sus contre l'hépatite B (vaccins hexavalents).

      Une analyse multivariée des pathologies présentées par la totalité des nourrissons sur plusieurs années est possible à partir des bases de données de l'assurance maladie et des outils informatiques modernes.

      Il ne s'agit pas bien sûr de comparer les enfants vaccinés contre l'hépatite B aux autres, ce qui n'aurait aucun intérêt du fait de biais de sélection.

      Il s'agit de voir si une ou plusieurs pathologies présentent un pic dans la cohorte des enfants nés pendant la rupture d'approvisionnement du vaccin pentavalent. Un tel pic, même s'il ne permettrait pas d'affirmer une relation de cause à effet, orienterait vers un problème lié spécifiquement au vaccin hexavalent, puisque ce vaccin aura été beaucoup plus souvent utilisé dans cette cohorte.

      De même, du fait de la puissance d'une telle comparaison (à cause de la taille des effectifs étudiés), une absence de pic dans les années suivant la vaccination permettrait de rassurer les parents qui craignent cette vaccination, en prouvant que le risque d'effet secondaire grave, s'il existe, est infinitésimal.

      Il existe quand même des biais (à vous de jouer dans les commentaires) car rien n'est jamais parfait.

      Voici comment les Big data, associées à des facteurs de rupture involontaires, permettraient de faire avancer la science.

      Accessoirement, le coût d'une telle étude est très faible.
      Bonjour,

      Je ne connais pas suffisamment les bases de données de l'assurance maladie pour être formel, mais pour moi l'exemple cité n'entre pas dans les 3 'v' et relève plus du 'simple' décisionnel que du big data. On n'est ni dans les zeta-octets de données, ni dans la grande variété, ... cf http://fr.m.wikipedia.org/wiki/Informatique_décisionnelle A mon avis, ce problème n'est pas plus compliqué que celui qui a permis, il y a déjà fort longtemps, de co-localiser couches culottes et packs de bière pour tenter les papas allant faire les courses le samedi, après analyse des tickets de caisse ...

      Commentaire


        #4
        Re : Big data

        Envoyé par vazivaza
        Bonjour,

        Je ne connais pas suffisamment les bases de données de l'assurance maladie pour être formel, mais pour moi l'exemple cité n'entre pas dans les 3 'v' et relève plus du 'simple' décisionnel que du big data. On n'est ni dans les zeta-octets de données, ni dans la grande variété, ... cf http://fr.m.wikipedia.org/wiki/Informatique_décisionnelle A mon avis, ce problème n'est pas plus compliqué que celui qui a permis, il y a déjà fort longtemps, de co-localiser couches culottes et packs de bière pour tenter les papas allant faire les courses le samedi, après analyse des tickets de caisse ...
        le terme big data en santé est effectivement galvaudé, à part si on se met à prendre en compte les futurs données des explorations *-omiques. mis bout à bout l'ensemble des données des plus grands hopitaux et l'ensemble des données des tutelles ne font pas passer le stade du "BIG" au sens traditionnel du terme. c'ets un terme à la mode, qui vient supplanter l'autre terme à la mode (mais moins impropre) de data-mining, bref c'est de l'analyse de données.

        ce qui est vraiment nouveau c'est la capacité à recouper des données peu structurées, mal identifiées, voir en "texte libre" pour en ressortir du signal viable (et les données hospitalières sont très mal structurées , même le sacro-saint PMSI + actes CCAM en externe ont des lacunes en termes de structure alors le reste....).

        pour l'aspect quantitatif ce n'est pas la quantité de données qui est impressionante, c'est que commence à être dispo des quantités de sujets (des patients) avec un suivi longitudinal sur de nombreuses années, et que l'on commence à s'interesser à comment exploiter tout ca.

        bien sur ce n'est qu'un outil, ce n'est pas l'outil qui est diabolique mais l'usage qui en est fait c'est comme un marteau, avec on peut enfoncer des clous ou bien fracasser la tête de son voisin, ca marche terriblement bien pour ces deux utilisations pourtant il n'y a pas de psychose sur la dangerosité du marteau, mais un cadre supérieur sur ce qui peut peut être fait ou non, indépendamment de l'outil utilisé. il faut legiférer sur les usages et pas trop sur les outils, sinon vu la latence du législateur la Loi aura toujours deux longueurs de retards sur les outils.

        Commentaire


          #5
          Re : Big data

          Envoyé par finwe
          le terme big data en santé est effectivement galvaudé, à part si on se met à prendre en compte les futurs données des explorations *-omiques. mis bout à bout l'ensemble des données des plus grands hopitaux et l'ensemble des données des tutelles ne font pas passer le stade du "BIG" au sens traditionnel du terme. c'ets un terme à la mode, qui vient supplanter l'autre terme à la mode (mais moins impropre) de data-mining, bref c'est de l'analyse de données.
          En même temps, on se prépare des problèmes que la médecine se sent incapable de résoudre et qui relèvent probablement, au moins pour partie, du big data. Parmi toutes les évolutions de nos modes de vie : ondes et rayonnementselectro-magnetiques, alimentation (avec une infinite de facteurs), stress et autres facteurs psychologiques ou liés au mode de vie, bisphenol, bouteilles plastiques, emballages, et autres joyeusetés alimentaires, ..., lesquelles impactent quelles maladies, au point de pouvoir expliquer les évolutions de nos pathologies, voire in fine de notre santé et notre espérance de vie ...

          volume de données, signaux faibles, aspects géographiques par exemple, ... on n'est pas loin de rentrer dans les clous, peut-être.

          Commentaire


            #6
            Re : Big data

            Envoyé par vazivaza
            En même temps, on se prépare des problèmes que la médecine se sent incapable de résoudre et qui relèvent probablement, au moins pour partie, du big data. Parmi toutes les évolutions de nos modes de vie : ondes et rayonnementselectro-magnetiques, alimentation (avec une infinite de facteurs), stress et autres facteurs psychologiques ou liés au mode de vie, bisphenol, bouteilles plastiques, emballages, et autres joyeusetés alimentaires, ..., lesquelles impactent quelles maladies, au point de pouvoir expliquer les évolutions de nos pathologies, voire in fine de notre santé et notre espérance de vie ...

            volume de données, signaux faibles, aspects géographiques par exemple, ... on n'est pas loin de rentrer dans les clous, peut-être.
            l'aspect variété est effectivement l'aspect des 3V qui est quasi rempli, par contre en volume et vitesse on est loin du compte.

            à ce sujet, sur des volumes faibles mais un bon cas de recoupement de données santé publiques/épidémio et environnementales:
            http://www.ncbi.nlm.nih.gov/pubmed/24319276
            Relationship between low-level air pollution and stroke is conflicting. This study was conducted to document the relationship between outdoor air pollution and ischaemic stroke occurrence.

            c'est du faible volume mais c'est une sorte de proof of concept de ce que vous avancez comme hypothese de croisement de données à un niveau plus massif dans un avenir proche (et du made in France au CHU de Nice).

            Commentaire

            Chargement...
            X