Accueil🇫🇷Chercher

Flux de données

Dans la communication orientée connexion, un flux de données est la transmission d'une séquence de signaux cohérents codés numériquement pour transmettre des informations[1]. Typiquement, les symboles transmis sont regroupées en des séries de paquets[2].

Le flux continu de données est devenu omniprésent. Tout ce qui est transmis sur Internet l'est sous forme de flux. L'utilisation d'un téléphone mobile pour avoir une conversation transmet le son sous forme de flux de données.

DĂ©finition Formelle

Un flux de données est un couple ordonné où :

  1. est une séquence de tuples et,
  2. est une séquence des réels positifs d'intervalles de temps.

Contenu

Un flux de données contient des différents ensembles de données, qui dépendent du format choisi.

  • Attributs : chaque attribut du flux reprĂ©sente un certain type de donnĂ©es, par exemple identifiant de segment/point de donnĂ©es, horodatage, information gĂ©ographique.
    • Horodatage : l'attribut qui permet d'identifier le moment oĂą un Ă©vĂ©nement s'est produit.
  • DonnĂ©es brutes : les informations provenant directement du fournisseur de donnĂ©es sans ĂŞtre traitĂ©es par un algorithme ni humain.
  • DonnĂ©es traitĂ©es : les donnĂ©es qui ont Ă©tĂ© traitĂ©es et prĂ©parĂ©es (d'une manière ou d'une autre modifiĂ©es, validĂ©es ou nettoyĂ©es), pour ĂŞtre utilisĂ©es pour des actions futures[3].

Usage

Il existe différents domaines dans lesquels les flux de données sont utilisés :

  • DĂ©tection des fraudes : les donnĂ©es brutes sont utilisĂ©es comme donnĂ©es source pour un algorithme anti-fraude (techniques d'analyse des donnĂ©es pour la dĂ©tection des fraudes). Par exemple, l'horodatage ou le nombre d'occurrences de cookies ou l'analyse de points de donnĂ©es sont utilisĂ©s dans le système de notation pour dĂ©tecter la fraude ou pour s'assurer qu'un destinataire de message n'est pas un bot.
  • Intelligence artificielle : les donnĂ©es brutes sont traitĂ©es comme un ensemble d'entraĂ®nement/apprentissage et un ensemble de teste lors de la construction d'algorithmes d'IA et d'apprentissage automatique.
  • DonnĂ©es brutes : utilisĂ©es pour le profilage et la personnalisation des profils d'utilisateurs et leur segmentation, par exemple, par sexe ou par lieu (basĂ© sur un point de donnĂ©es).
  • Informatique dĂ©cisionnelle : les donnĂ©es brutes sont une source d'informations pour les systèmes d'informatique dĂ©cisionnelle, utilisĂ©es pour enrichir les profils des utilisateurs avec des informations dĂ©taillĂ©es Ă  leur sujet, par exemple, le parcours d'achat ou les informations gĂ©ographiques . Ces informations sont utilisĂ©es pour l'analyse commerciale et la recherche prĂ©dictive.
  • Ciblage : les donnĂ©es traitĂ©es par les scientifiques des donnĂ©es amĂ©liorent les campagnes en ligne et sont utilisĂ©es pour atteindre le public cible.
  • Enrichissement GRC : les donnĂ©es brutes sont intĂ©grĂ©es au système de gestion de la relation client. L'intĂ©gration GRC permet de combler les lacunes dans les profils des utilisateurs avec des donnĂ©es dĂ©mographiques, des intĂ©rĂŞts ou des intentions d'achat.

Intégration

Les intégrations de base avec les flux de données sont :

  • Les flux de donnĂ©es sont intĂ©grĂ©s Ă  des systèmes tels que la plateforme de donnĂ©es client, la gestion de la relation client (GRC) ou la plateforme de gestion de donnĂ©es pour enrichir les profils des utilisateurs avec des donnĂ©es externes. Il est possible d'Ă©largir les connaissances sur les utilisateurs existants en utilisant des sources externes.
  • Les flux de donnĂ©es sont utilisĂ©s pour enrichir les systèmes d'informatique dĂ©cisionnelle et rendre l'analyse et les conclusions plus prĂ©cisĂ©ment.
  • Dans le cas de l'intĂ©gration d'un système de gestion de contenu (SGC), le flux de donnĂ©es est utilisĂ© pour identifier les utilisateurs et personnaliser leur visite, mĂŞme s'il s'agit de leur première visite. Grâce Ă  l'analyse des donnĂ©es, le contenu rĂ©el du site Web est adaptĂ© Ă  l'utilisateur.
  • Les flux de donnĂ©es sont intĂ©grĂ©s Ă  la plate-forme cĂ´tĂ© demande au sein d'un Ă©cosystème de publicitĂ© numĂ©rique. Les parties (par exemple, les annonceurs) peuvent Ă©changer les identifiants des utilisateurs et concatĂ©ner entre eux les profils existants.
  • Les flux de donnĂ©es sont utilisĂ©s pour choisir les segments d'utilisateurs respectifs (par exemple, les personnes intĂ©ressĂ©es par l'industrie automobile) et les utiliser dans une campagne en ligne. Les segments sont enrichis avec plus de caractĂ©ristiques utilisateur hors du flux de donnĂ©es, puis envoyĂ©s Ă  la plate-forme cĂ´tĂ© demande.

Source de données visibles

Dans un flux de données, le type d'appareil utilisé par l'utilisateur est visible via un user agent :

  • Mobile : lorsqu'un utilisateur utilise un navigateur mobile pour explorer, il a respectivement une rĂ©solution d'Ă©cran Ă©troite et une version d'application mobile.
  • Bureau : lorsqu'un utilisateur utilise un navigateur d'ordinateur de bureau ou une version d'application bureau.

Les informations suivantes sont partagées hors de l'appareil utilisé :

Formats

Un point de données est une balise qui collecte des informations sur une certaine action, effectuée par un utilisateur sur un site Web. Les points de données sont de deux types, dont les valeurs sont utilisées pour créer des audiences appropriées. Ces deux types sont :

  • Ă©vènement, avec des informations sur les occurrences de l'Ă©vènement spĂ©cifique (par exemple, cliquer sur un lien ou afficher une annonce) ;
  • attribut, avec des valeurs numĂ©riques ou alphanumĂ©riques.

Segment : une déclaration logique, construite sur des points de données spécifiques à l'aide des opérateurs ET, OU ou NON[4].

Données hybrides : données brutes avec le format des points de données et des segment de données.

URL : est un ensemble d'informations sur une URL particulière qui a été visitée.

Protection des données

En Europe, la protection des données est régie par le RGPD [5].

Les informations recueillies sur les sites Web sont basées sur le comportement des utilisateurs. Les fournisseurs de données fournissent des informations personnelles ou non personnelles. Deux types de données utilisateur sont disponibles dans le flux de données :

  • donnĂ©es Ă  caractère non personnel : informations qui ne peuvent pas ĂŞtre utilisĂ©es pour identifier une personne ou pour suivre un emplacement. Un cookie ou un ID d'appareil sont des exemples de donnĂ©es Ă  caractère non-personnel.

Notes et références

  1. « Definition: data stream », sur www.its.bldrdoc.gov (consulté le )
  2. (en) « What is a Data Stream? - Definition from Techopedia », sur Techopedia.com (consulté le )
  3. « Que couvre le traitement des données? » (consulté le )
  4. (en) Pavel Malos, « The 6 types of user segmentation and what they mean for your product », sur Medium, (consulté le )
  5. « Protection des données dans l’UE », sur Commission européenne - European Commission (consulté le )
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.