Rejoignez-Nous sur

Postulat de sentiment vérifié par la blockchain – Par Christian Kameir

f013n23yi

News

Postulat de sentiment vérifié par la blockchain – Par Christian Kameir

f013n23yi

L'explosion de contenu sur le World Wide Web, les médias sociaux et les réseaux de discussion a considérablement accru l'intérêt pour l'analyse des sentiments d'un nombre et d'une variété croissants de parties intéressées.

En outre, la dépendance croissante des utilisateurs d'Internet à l'égard des avis, des notes, des recommandations et d'autres formes d'expression numérique en ligne, a transformé les opinions provenant de la foule en une forme de monnaie virtuelle pour les entreprises qui cherchent à commercialiser leurs produits, à identifier de nouvelles opportunités et à gérer leur réputation.

Le texte n'est pas un fait pur. La majorité des sources de données utilisées dans l'analyse des sentiments aujourd'hui manquent de spécificité de sujet, ce qui crée un pool de sources de données bruyant et souvent surexploité.

Une solution plus exigeante doit permettre aux développeurs de choisir parmi une grande variété de sources, en ajoutant des sources supplémentaires et en les regroupant à des fins spécifiques. Cette approche à longue traîne devrait fournir une pertinence beaucoup plus grande des données sources que des sources plus génériques – c'est-à-dire Twitter.

Alors que les spécialistes du marketing, les commerçants et les conseillers politiques cherchent à automatiser le processus de filtrage du bruit, de compréhension des conversations, d'identification du contenu pertinent et de prise des mesures appropriées, beaucoup recherchent des solutions plus sophistiquées dans le domaine de l'analyse des sentiments. Ce schéma cherche à résoudre les problèmes fondamentaux auxquels est confrontée l'analyse des sentiments aujourd'hui en tenant compte de la nécessité de différents secteurs verticaux clés.

2CARJKZeSLSLZqCN7VhaikaCox93 dbc7233t

Normalisation et étiquetage

Les données de source des sentiments manquent souvent de la standardisation la plus élémentaire et même de petits changements dans l'environnement des données en cours d'agrégation peuvent les rendre inutiles à des fins d'analyse. .. inciter les propriétaires de sites Web et les modérateurs à fournir des flux autorisés et standardisés à la plate-forme et permet en outre aux développeurs de créer des demandes de marquage.

Dictionnaire des sentiments

La plupart des solutions d’analyse des sentiments ne fournissent qu’un étiquetage général d’informations telles que «positives» ou «négatives». Cependant, de nombreux cas d'utilisation nécessitent un étiquetage plus nuancé et / ou personnalisé des flux de données – c'est-à-dire pour les signaux d'achat / vente d'actions ou de produits de base ou les opinions sur le résultat d'un événement. Une approche sophistiquée permettra aux développeurs de créer des «dictionnaires de sentiments» – des outils d’étiquetage spécifiques au contenu adaptés à leur objectif.

Interfaces de programmation

Le système devrait fournir un ensemble d'interfaces de programmation d'applications (API) ouvertes, permettant aux développeurs de créer des plugins et des outils d'analyse personnalisés. Ceux-ci seront accessibles via la plateforme, ce qui permettra aux utilisateurs d'acheter des données de sentiment utilisateur et diverses fonctionnalités personnalisées.

Traitement des sentiments et du langage naturel

La précision d'un système d'analyse des sentiments dépend en principe de l'intersection des jugements des êtres humains avec les logiciels de traitement du langage naturel. Ceci est établi par différentes mesures basées sur la précision et le rappel sur deux ou plusieurs catégories cibles telles que les phrases négatives, positives et neutres.

Cependant, selon la recherche, les évaluateurs humains ne conviennent en moyenne que dans 80% des cas. Ainsi, un programme qui atteint une précision de 70% dans la classification des sentiments se porte presque aussi bien que les humains. Si un programme était "correct" 100% du temps, les humains seraient toujours en désaccord avec son évaluation 20% du temps en moyenne, car les gens ne sont pas du tout d'accord sur une réponse.

D'un autre côté, les systèmes informatiques commettront des erreurs très différentes de celles des évaluateurs humains, et les chiffres ne sont donc pas entièrement comparables. Par exemple, un système informatique aura des problèmes de négations, d'exagérations, d'humour ou de sarcasme, qui sont généralement faciles à manipuler pour un lecteur humain, et certaines classifications qu'un programme informatique établit sembleront simplistes pour un humain.

En général, l'utilité des tâches commerciales pratiques de l'analyse des sentiments telle qu'elle est définie dans la recherche universitaire a été remise en question, principalement parce que le modèle unidimensionnel simple du sentiment du négatif au positif fournit peu d'informations exploitables pour une entreprise qui s'inquiète de l'effet du discours public sur par exemple marque ou réputation de l'entreprise. Et les traders d’actions et de matières premières bénéficieront davantage de signaux liés à «l’achat» et à la «vente» qu’au sentiment général.

Pour mieux répondre aux besoins du marché, l'évaluation de l'analyse des sentiments est aujourd'hui passée à des mesures davantage basées sur les tâches; par exemple: pour les professionnels des études de marché, l'ensemble des données d'évaluation met moins l'accent sur le contenu du texte considéré et plus sur l'effet du texte en question sur la réputation de la marque.

Méthode et caractéristiques

Les approches existantes de l'analyse des sentiments peuvent être regroupées en trois catégories principales: les techniques basées sur la connaissance, les méthodes statistiques et les approches hybrides (Cambria, E; Schuller, B; Xia, Y; Havasi, C (2013). "De nouvelles avenues dans l'exploration d'opinion et analyse des sentiments ". IEEE Intelligent Systems. 28 (2): 15-21). Les trois catégories présentent des inconvénients importants qui peuvent être résolus en utilisant les approches décrites.

La théorie des graphes

Les méthodes de la théorie des graphes, sous diverses formes, se sont révélées particulièrement utiles dans l'analyse des sentiments, car le langage naturel se prête souvent bien à une structure discrète. Traditionnellement, la syntaxe et la sémantique de la composition suivent des structures arborescentes, dont le pouvoir expressif réside dans le principe de composition, modélisé dans un graphe hiérarchique.

Des approches plus contemporaines telles que la grammaire de la structure des phrases guidées par la tête modélisent la syntaxe du langage naturel utilisent des structures de caractéristiques typées, qui sont des graphiques acryliques dirigés.

Au sein de la sémantique lexicale, en particulier appliquée aux ordinateurs, la modélisation de la signification des mots est plus facile lorsqu'un mot donné est compris en termes de mots apparentés; les réseaux sémantiques sont donc importants en linguistique computationnelle.

Pourtant, d'autres méthodes en phonologie (par exemple la théorie optimale, qui utilise des graphes en réseau) et en morphologie (par exemple la morphologie à états finis, en utilisant des transducteurs à états finis) sont courantes dans l'analyse du langage sous forme de graphique. L'utilité de ce domaine des mathématiques pour l'analyse sémantique a porté des organisations telles que TextGraphs, ainsi que divers projets «Net», tels que WordNet, VerbNet, et d'autres.

Métrique de cohésion de base

La métrique de cohésion de base est basée uniquement sur la fréquence des nœuds porteurs de sentiments dans ou dérivé du texte source, c'est-à-dire la somme des valeurs de polarité pour tous les nœuds du graphique.

Type de relation métrique

La métrique de type de relation modifie la métrique de base en fonction des types de relations dans le graphique dérivé du texte. Pour chaque nœud du graphique, sa valeur de sentiment est le produit de sa valeur de polarité et un poids de relation pour chaque relation dans laquelle ce nœud entre dans la structure du graphique.

Contrairement à la plupart des algorithmes de chaînage lexical, toutes les relations ne sont pas traitées comme égales. Dans cette superposition de sentiments, les relations jugées les plus pertinentes sont celles qui dénotent potentiellement une relation de la dimension effective, comme les antonymes, et celles qui constituent les principes d'organisation clés de la base de données, comme l'hypernymie.

Un hyponyme est un mot ou une phrase dont le champ sémantique est inclus dans celui d'un autre mot, son hyperonyme ou hypernyme. Par exemple, le pigeon, le corbeau, l'aigle et la mouette sont tous des hyponymes d'oiseau (leur hypernyme); qui, à son tour, est un hyponyme d'animal. Les relations qui affectent potentiellement les relations ont la pondération la plus forte tandis que les relations plus amorphes, comme «voir aussi», ont les plus faibles.

Mesure de spécificité de nœud

La métrique de spécificité de nœud (c'est-à-dire les sites choisis dans le pool de ressources disponibles) modifie la métrique de base par rapport à une mesure de spécificité de nœud calculée sur la base des caractéristiques topographiques de la base de données lexicale.

L'intuition derrière cette mesure est que des nœuds ou des concepts très spécifiques peuvent véhiculer un contenu plus informatif et, par extension, affectif que des contenus moins spécifiques.

Les chercheurs ont constaté la difficulté d'utiliser une base de connaissances dont la structure interne n'est pas homogène et dont les idiosyncrasies ne sont pas quantifiées.

La mesure de spécificité vise à factoriser la rareté ou la densité des populations dans les bases de données lexicales en évaluant la contribution de chaque nœud par rapport à sa profondeur dans la hiérarchie, sa connectivité (liens) et les autres sites de son cluster.

Reconnaissance d'entité nommée

Utiliser la reconnaissance d'entité nommée (NER) pour localiser et classer les entités nommées dans le texte en catégories prédéfinies telles que les noms de personnes, d'organisations, de lieux, d'expressions de temps, de quantités, de valeurs monétaires, etc. La

Dans l'expression entité nommée, le mot nommé limite la tâche aux entités pour lesquelles une ou plusieurs chaînes, telles que des mots ou des phrases, représentent systématiquement un référent. Ceci est étroitement lié aux désignations rigides, bien qu'en pratique le NER traite de nombreux noms et référents qui ne sont pas philosophiquement "rigides".

Par exemple, des termes tels que «Jaguar» peuvent faire référence à l’animal ou au constructeur automobile. «Ford», la société automobile créée par Henry Ford en 1903, peut être appelée Ford ou Ford Motor Company, bien que «Ford» puisse également désigner de nombreuses autres entités.

Les désignations rigides incluent les noms propres ainsi que les termes de certaines espèces et substances biologiques, mais excluent les pronoms, les descriptions qui désignent un référent par ses propriétés, et les noms de types de choses par opposition aux individus (par exemple "Banque").

Résolution de coréférence

Les résolutions de coréférence visent à trouver (toutes) les expressions qui font référence à l'entité s ame dans un texte. Il s'agit d'une étape importante vers des tâches de PNL de niveau supérieur qui impliquent la compréhension du langage naturel, telles que la synthèse de documents, la réponse à des questions et l'extraction d'informations.

Dictionnaire du sentiment général

Le système peut utiliser Wikipedia comme son général Sentiment Dictionary (GSD) ou les approches basées sur la blockchain utiliseront probablement Everipedia dans sa prochaine itération. L'encyclopédie d'Everipedia est reconnue comme la plus grande encyclopédie en ligne en anglais, avec plus de 6 millions d'articles, y compris tous les articles de Wikipedia anglais. Il a été étiqueté comme un «  fork '' et un «  pack d'extension '' pour Wikipedia, car il fournit une gamme d'articles beaucoup plus large que Wikipedia en anglais. Cela est dû au seuil inférieur de notabilité d'Everipedia et à l'accent mis sur les critères inclusifs.

Dictionnaire des sentiments issus de la foule

En raison du besoin d'outils d'analyse des sentiments spécifiques au contexte et du langage riche utilisé pour exprimer les sentiments dans un texte coloré par des sujets spécifiques (par exemple, la politique), l'analyse automatique des sentiments souffre fortement de la rareté des données de sentiments annotées.

Cela est particulièrement vrai pour le sentiment directionnel, c'est-à-dire les annotations selon lesquelles un détenteur a un sentiment sur une cible spécifique.

Une composante d'analyse humaine est requise dans l'analyse des sentiments, car les systèmes automatisés ne sont pas en mesure d'analyser les tendances historiques du commentateur individuel ou de la plate-forme et sont souvent classés incorrectement dans leur sentiment exprimé.

L'automatisation affecte environ 23% des commentaires correctement classés par les humains (http://paragonpoll.com/sentiment-analysis-systems-case-study/).

Cependant, les humains sont souvent en désaccord, et il est avancé que l'accord inter-humain fournit une limite supérieure que les classificateurs de sentiments automatisés peuvent éventuellement atteindre (http://journals.plos.org/plosone/article?id=10.1371/journal.pone). 0155 036).

Un dictionnaire des sentiments issu de la foule est soutenu par un algorithme incitatif basé sur le consensus qui garantit l'exactitude des étiquettes choisies grâce à la validation de 3 à 5 accords. Chaque nouveau label reçoit nominalement des jetons de récompense.

Cependant, ces jetons sont misés jusqu'à ce qu'un minimum de trois matchs soient atteints. Si, après trois événements d'étiquetage, un consensus n'a pas été atteint, le mécanisme de consensus est prolongé jusqu'à ce qu'un consensus d'au moins 80% soit atteint.

La recherche montre que le nombre moyen d'accord d'étiquetage humain est atteint en cinq événements d'étiquetage, ce qui donne en moyenne une (1) récompense de jeton par activité d'étiquetage dans le cas d'utilisation susmentionné.

Blockchain

Une plate-forme de sentiment pourrait être construite sur la blockchain EOSIO pour effectuer un traitement d'analyse de sentiment des utilisateurs. EOSIO permet la décentralisation de la puissance de calcul et du stockage nécessaires à la gestion des mégadonnées. En plus de répartir les coûts de fonctionnement de la plate-forme, cette approche décentralisée tire parti de la sécurité de la blockchain en horodatant immuablement les contributions numériques.

L'objectif d'une plate-forme basée sur EOSIO – ou une copie de celle-ci – est de fournir un hébergement d'applications décentralisé, une capacité de contrat intelligent et des solutions d'entreprise de stockage décentralisé qui résolvent les problèmes d'évolutivité des chaînes de blocs comme Bitcoin et Ethereum, ainsi que l'élimination des frais pour les utilisateurs. Le système de consensus de structure multithread d'EOSIO (preuve déléguée de participation) le rend idéalement adapté à une plate-forme décentralisée d'analyse des sentiments.

Un jeton natif est un jeton utilitaire qui fournit à la fois de la bande passante et du stockage sur une blockchain, proportionnellement à la mise totale. Les jetons permettent également au propriétaire de voter et de participer à la gouvernance en chaîne de la plate-forme, toujours proportionnellement à la participation du propriétaire.

Mécanismes de consensus

Preuve d'enjeu

Le système de consensus de preuve d'enjeu a été créé comme une alternative à la preuve de travail (PoW), pour résoudre des problèmes tels que la consommation d'énergie en PoW et la latence.

Lorsqu'une transaction – telle que le flux d'un commentaire vers le pool de données – est lancée, les données de transaction et les métadonnées sont intégrées dans un bloc d'une capacité maximale de 1 mégaoctet, puis dupliquées sur plusieurs ordinateurs ou nœuds du réseau .

Les nœuds sont l'organe administratif de la blockchain et vérifient la légitimité des transactions dans chaque bloc. Pour effectuer l'étape de vérification, les nœuds ou les mineurs devraient résoudre un casse-tête informatique, connu sous le nom de problème de preuve de travail.

Le premier mineur à décrypter chaque problème de transaction de bloc est récompensé par une pièce. Une fois qu'un bloc de transactions a été vérifié, il est ajouté à la blockchain, un registre public transparent.

L'exploitation minière nécessite des quantités importantes de puissance de calcul pour exécuter différents calculs cryptographiques qui résolvent les défis informatiques. La puissance de calcul nécessite une grande quantité d'électricité et de puissance nécessaire pour la preuve de travail.

En 2015, il a été estimé qu'une transaction Bitcoin nécessitait la quantité d'électricité nécessaire pour alimenter jusqu'à 1,5 ménage américain par jour. Pour payer la facture d'électricité, les mineurs vendraient généralement leurs pièces attribuées contre de la monnaie fiduciaire, ce qui entraînerait une baisse du prix de la crypto-monnaie.

La preuve de participation (PoS) résout ce problème en attribuant la puissance minière à la proportion de pièces détenues par un mineur. De cette façon, au lieu d'utiliser de l'énergie pour répondre aux énigmes PoW, un mineur PoS se limite à extraire un pourcentage de transactions qui reflète sa participation. Par exemple, un mineur qui possède 3% du Bitcoin disponible ne peut théoriquement extraire que 3% des blocs.

Bitcoin utilise un système PoW et en tant que tel est susceptible d'une tragédie potentielle de Commons. La tragédie des communes fait référence à un moment futur où il y aura moins de mineurs de bitcoins disponibles en raison de peu ou pas de récompense de bloc provenant de l'exploitation minière.

Les seuls frais qui seront gagnés proviendront des frais de transaction qui diminueront également avec le temps, car les utilisateurs choisiront de payer des frais moins élevés pour leurs transactions. Avec moins de mineurs que nécessaire pour l'extraction de pièces, le réseau devient plus vulnérable à une attaque de 51%.

Une attaque à 51% se produit lorsqu'un mineur ou un pool minier contrôle 51% de la puissance de calcul du réseau et crée des blocs de transactions frauduleux pour lui-même, tout en invalidant les transactions des autres sur le réseau.

Avec un PoS, l'attaquant aurait besoin d'obtenir 51% de la crypto-monnaie pour mener une attaque de 51%. La preuve de participation évite ce problème en rendant désavantageux pour un mineur avec une participation de 51% dans une crypto-monnaie d'attaquer le réseau.

Bien qu'il soit difficile et coûteux d'accumuler 51% d'une pièce numérique réputée, un mineur détenant 51% du capital ne serait pas dans son intérêt d'attaquer un réseau qu'il détient en majorité.

Si la valeur de la crypto-monnaie diminue, cela signifie que la valeur de ses avoirs diminuerait également, et donc le propriétaire de la participation majoritaire serait plus incité à maintenir un réseau sécurisé.

Preuve de participation déléguée

Pour atténuer le potentiel de centralisation et les impacts négatifs associés, le système utilise une preuve de participation déléguée (DPOS). IN DPOS un total de N témoins signent les blocs et sont votés par ceux qui utilisent le réseau à chaque transaction.

En utilisant un processus de vote décentralisé, le DPOS est par conception plus démocratique que des systèmes comparables. Plutôt que d'éliminer le besoin de confiance tous ensemble, DPOS a des garanties en place pour garantir que les personnes de confiance avec des blocs de signature au nom du réseau le font correctement et sans parti pris.

De plus, chaque bloc signé doit avoir une vérification que le bloc avant sa signature par un nœud de confiance. DPOS élimine le besoin d'attendre qu'un certain nombre de nœuds non approuvés aient vérifié une transaction avant de pouvoir la confirmer.

Ce besoin réduit de confirmation entraîne une augmentation de la vitesse des temps de transaction. En accordant intentionnellement la confiance au plus fiable des signataires potentiels de bloc, comme décidé par le réseau, aucune charge artificielle n'a besoin d'être imposée pour ralentir le processus de signature de bloc. DPOS permet d'inclure beaucoup plus de transactions dans un bloc que les systèmes de preuve de travail ou de preuve de mise.

La technologie DPOS permet à la technologie de crypto-monnaie de transiger à un niveau où elle peut rivaliser avec les chambres de compensation centralisées comme Visa et Mastercard. Ces chambres de compensation administrent les formes de systèmes de paiement électronique les plus populaires au monde.

Dans un système de preuve de participation délégué, la centralisation se produit toujours, mais elle est contrôlée. Contrairement à d'autres méthodes de sécurisation des réseaux de crypto-monnaie, chaque client d'un système DPOS a la possibilité de décider qui est de confiance plutôt que de se concentrer entre les mains de ceux qui ont le plus de ressources.

DPOS permet au réseau de récolter certains des principaux avantages de la centralisation, tout en conservant une certaine mesure calculée de la décentralisation. Ce système est mis en œuvre par un processus électoral équitable où n'importe qui pourrait potentiellement devenir un représentant délégué de la majorité des utilisateurs.

Justification du DPOS

Donner aux actionnaires un moyen de déléguer leur vote à une clé (celle qui ne contrôle pas les pièces «afin qu'elles puissent extraire»)

● Maximisez les dividendes que les actionnaires gagnent

● Minimisez le montant payé pour sécuriser le réseau

● Maximiser les performances du réseau

● Minimiser le coût de fonctionnement du réseau (bande passante, CPU, etc.)

● Les actionnaires contrôlent

La caractéristique fondamentale de DPOS est que les actionnaires gardent le contrôle. S'ils gardent le contrôle, c'est décentralisé. Aussi imparfait que puisse être le vote, lorsqu'il s'agit de la propriété partagée d'une entreprise, c'est le seul moyen viable. Heureusement, si vous n'aimez pas qui dirige l'entreprise, vous pouvez vendre et cette rétroaction du marché pousse les actionnaires à voter de manière plus rationnelle que les citoyens.

Chaque actionnaire peut voter pour que quelqu'un signe des blocs à sa place (un représentant si vous voulez). Toute personne qui peut obtenir 1% ou plus des votes peut rejoindre le conseil d'administration.

Les représentants deviennent un «conseil d'administration» qui, à tour de rôle, signe des blocs. Si l'un des administrateurs manque son tour, les clients lui écarteront automatiquement leur vote.

Finalement, ces administrateurs seront élus par le conseil d'administration et quelqu'un d'autre se joindra. Les membres du conseil d'administration sont payés un petit jeton pour que cela en vaille la peine d'assurer une disponibilité et une incitation à faire campagne.

Ils affichent également une petite caution égale à 100 fois le salaire moyen qu'ils reçoivent pour la production d'un seul bloc. Pour réaliser un bénéfice, un administrateur doit avoir un temps de disponibilité supérieur à 99%.

L'exploitation minière en commun comme preuve de travail déléguée

En quoi est-ce différent d'un consensus sur la preuve du travail (Pow)? Avec PoW, les utilisateurs doivent choisir un pool de minage et chaque pool a généralement 10% ou plus de la puissance de hachage. L'opérateur de ces pools est comme un représentant des clients pointés sur le pool.

Les systèmes PoW s'attendent à ce que les utilisateurs changent de pool pour éviter que l'alimentation ne devienne trop centralisée, mais collectivement, cinq pools principaux contrôlent le réseau et une intervention manuelle de l'utilisateur est attendue si l'un des pools est compromis. Si un pool diminue, le taux de production de blocs ralentit proportionnellement jusqu'à ce qu'il remonte. Le pool avec lequel on exploite devient une question de politique.

Raisons de ne pas sélectionner au hasard les représentants de tous les utilisateurs:

● Forte probabilité qu'ils ne soient pas en ligne

● Les attaquants gagneraient un contrôle proportionnel à leur mise, sans examen par les pairs

● Sans aucune extraction, la génération d'un nombre aléatoire de manière décentralisée est impossible et donc un attaquant pourrait contrôler la génération de nombres aléatoires

Évolutivité

L'utilisation d'un coût de validation fixe par transaction et d'une redevance fixe par transaction entraîne des limites au niveau de décentralisation qui peut avoir lieu.

En supposant que le coût de validation est exactement égal aux frais, un réseau est complètement centralisé et ne peut se permettre qu'un seul valideur. En supposant que les frais représentent 100 fois le coût de la validation, le réseau peut prendre en charge 100 validateurs.

Les développeurs de DPOS supposent que tout le monde avec moins que le montant requis pour valider ne participera pas. On suppose également une distribution «raisonnable» de la richesse. Il est clair que, à moins que les chaînes alternatives n'engendrent des frais anormalement élevés, il n'y aura qu'une poignée de personnes avec suffisamment de mises pour valider de manière rentable.

En conclusion, la seule façon pour POS de fonctionner efficacement est de déléguer. Dans le cas des jetons, les détenteurs peuvent mettre en commun leur participation par certains moyens et, finalement, cela se terminera comme DPOS avant le vote d'approbation avec un nombre variable de délégués.

Les délégués ne recevraient en fait aucun revenu comme avec les pools de minage car les dépenses de validation consommeront la grande majorité des frais de transaction.

Le résultat final est que la décentralisation a un coût proportionnel au nombre de validateurs et que les coûts ne disparaissent pas. À grande échelle, ces coûts centraliseront tout système qui ne prend pas en charge la délégation.

Ce type de centralisation doit être conçu dès le départ comme un élément du système afin qu'il puisse être correctement géré et contrôlé par les utilisateurs, au lieu d'évoluer de manière ponctuelle comme conséquence involontaire.

Rôle des délégués

Un témoin sur la blockchain est une autorité qui est autorisée à produire et à diffuser des blocs. La production d'un bloc consiste à collecter les transactions du réseau P2P et à le signer avec la clé privée de signature du témoin.

Une place de témoin dans la ronde est attribuée au hasard à la fin du bloc précédent

Une analyse

Les futurs outils d'analyse des sentiments utiliseront un balisage plus granulaire et / ou adapté au sujet.

Émotion: brève évaluation organiquement synchronisée d'un événement majeur

● En colère, triste, joyeux, craintif, honteux, fier, exalté

● Humeur: variation diffuse non provoquée de longue durée et de faible intensité du sentiment subjectif

● Gai, sombre, irritable, apathique, déprimé, flottant

● Positions interpersonnelles: position efficace envers une autre personne dans une interaction spécifique

● Sympathique, coquette, distante, froide, chaleureuse, solidaire, méprisante

● Attitudes: croyances durables et efficacement colorées,

dispositions envers les objets ou les personnes

● aimer, aimer, détester, valoriser, désirer

● Traits de personnalité: personnalité stable

dispositions et tendances typiques du comportement

● nerveux, anxieux, téméraire, morose, hostile, jaloux

Exemples de cas d'utilisation

Commerce d'actifs virtuels et de crypto-monnaie

Bien que l'analyse des sentiments soit un outil standard pour les commerçants d'actions et de matières premières dans le monde entier depuis des années, ces outils sont pratiquement inexistants pour le trading d'actifs virtuels.

Bien que naissants, ces marchés ont déjà atteint des volumes de négociation quotidiens de 15 à 25 milliards de dollars.

Le problème de la validité des informations est multiplié par les incitations de la foule à manipuler le sentiment du marché. FUDers FUD pour serrer la main faible et réclamer leurs pièces, et Mooners battage pour obtenir leur retour sur intérêt (ROI) au détriment des nouveaux arrivants.

Cette dynamique ouvre les crypto-marchés aux escrocs de toutes sortes. De petites quantités d'informations précieuses sont souvent la clé de profits incroyables, donc pour le commerçant ou l'investisseur ambitieux, la recherche exhaustive doit se poursuivre. Mais le manque de réputation claire et fiable rend cette information et ces données difficiles à acquérir.

La confiance coûte cher, et les marchés de la cryptographie ne peuvent pas se professionnaliser tant que ces problèmes ne sont pas résolus.

Politique et gouvernance

L'analyse de la polarité des textes a une longue tradition en politique et en gouvernance. Un exemple frappant est la négativité des médias, un concept qui capture la sur-sélection de nouvelles négatives plutôt que positives, la tonalité des articles médiatiques et le degré de conflit ou de confrontation dans les nouvelles.

Sa «mesure dans la recherche analytique de contenu quantitatif peut être définie comme le processus de liaison de certains aspects des données textuelles à des valeurs numériques qui représentent la présence, l'intensité et la fréquence des aspects textuels pertinents pour la recherche en communication» (Lengauer et al. 2012, p. 183).

Un certain nombre d'études récentes démontrent les avantages de l'analyse des sentiments pour de telles analyses (Van Atteveldt et al.2008; Soroka 2012; Young et Soroka 2012; Burscher et al.2015; Soroka et al.2015a , B). L'analyse des sentiments a également été utilisée pour établir le niveau de soutien aux propositions législatives ou de polarisation à partir de l'analyse des débats parlementaires (Monroe et al.2008), pour identifier les positions sur les problèmes ou l'opinion publique dans les débats en ligne (Hopkins et King 2010; Ceron et al.2012; González-Bailón et Paltoglou 2015), ou pour étudier les campagnes négatives (Kahn et Kenney 2004; Lau et Pomper 2004; Geer 2006; Nai et Walter 2015) pour mentionner quelques utilisations importantes.

Les paris sportifs

Les écarts de points et les lignes over / under sont définis par les agences de paris sportifs pour refléter toutes les informations accessibles au public sur les jeux à venir, y compris les performances de l'équipe et les perspectives perçues des fans.

En supposant l'efficacité du marché, il ne faut pas être en mesure de concevoir une stratégie de paris qui gagne suffisamment souvent pour être rentable.

Plusieurs chercheurs ont conçu des modèles pour prédire les résultats du jeu. Hong et Skiena a utilisé l'analyse des sentiments des actualités et des médias sociaux pour concevoir une stratégie de paris réussie.

Cependant, leur évaluation principale portait sur les données de l'échantillon plutôt que sur les prévisions. De plus, ils ne disposaient que de données Twitter d'une saison (2009) et ne les utilisaient donc pas dans leurs expériences principales.

Nous utilisons de grandes quantités de tweets des saisons 2010-2012 et nous le faisons dans un véritable cadre de prévision pour les WTS gagnants et les prédictions over / under.

Marketing et image de marque

Pour comprendre les sentiments des clients à l'égard d'une marque, il est important d'analyser régulièrement le sentiment social. C'est un exercice qui aide à comprendre les sentiments des gens à l'égard d'une entreprise, d'un produit ou d'un service.

Les entreprises peuvent utiliser un outil d'analyse de sentiment automatique pour obtenir un aperçu simple de la santé de votre marque sans analyser chaque publication.

Évaluation des avis

Il existe une variété d'applications potentielles pour l'évaluation automatique des avis. Le système de Tong (2001) pour détecter et suivre les opinions dans les discussions en ligne pourrait bénéficier de l'utilisation d'un algorithme d'apprentissage, au lieu (ou en plus) d'un lexique construit à la main.

Grâce à l'évaluation automatisée des avis (avis), les annonceurs pouvaient suivre les campagnes publicitaires, les politiciens pouvaient suivre l'opinion publique, les journalistes pouvaient suivre la réponse du public aux événements actuels et les analyseurs de tendances pouvaient suivre les tendances en matière de divertissement et de technologie.

Oracles pour l'algorithme d'évaluation des sentiments

Les oracles dans le contexte des blockchains et des contrats intelligents sont des agents qui recherchent et vérifient les occurrences du monde réel et soumettent ces informations à une blockchain à utiliser par les contrats intelligents.

Les contrats intelligents contiennent de la valeur et ne débloquent cette valeur que si certaines conditions prédéfinies sont remplies. Lorsqu'une valeur particulière est atteinte, le contrat intelligent change son état et exécute les algorithmes prédéfinis par programme, déclenchant automatiquement un événement sur la blockchain.

La tâche principale des oracles est de fournir ces valeurs au contrat intelligent de manière sécurisée et fiable. Les blockchains ne peuvent pas accéder aux données en dehors de leur réseau.

Un oracle est un flux de données – fourni par un tiers ou un service – conçu pour les contrats intelligents sur une blockchain. Oracles fournit des données externes et déclenche des exécutions de contrat intelligentes lorsque les conditions prédéfinies sont remplies. Une telle condition pourrait être des données telles que la température météorologique, le paiement réussi, les fluctuations de prix, etc.

La plate-forme devrait permettre le déploiement d'oracles logiciels entrants pour évaluer les performances et la précision des algorithmes de sentiment qui prédisent les événements du monde réel (RWO). Des exemples pour RWO sont:

  • Résultats des événements sportifs rapportés sur les sites d'actualités, à savoir – Courses de chevaux et de voitures
  • Nominations politiques
  • Cotations publiques (actions; monnaies virtuelles)

Les développeurs peuvent déployer des oracles qui confirment les résultats prédits par leurs algorithmes de sentiment. Pour déployer un oracle, le développeur impliquera un certain nombre de jetons («Oracle Stakes» ou «OS»).

Les développeurs peuvent définir leur propre niveau de confiance (CL) pour le résultat de la prédiction de l'algorithme de sentiment auquel le système d'exploitation sera appliqué (c'est-à-dire 75%).

Tant que le CL est atteint ou que la valeur est dépassée par le résultat signalé par l'oracle, aucun système d'exploitation n'est transféré. Si le CL n'est pas atteint, les jetons de l'OS sont transférés aux abonnés de l'algorithme.

Pourquoi Sentiment sur la blockchain

Les commentaires et les publications sur les réseaux sociaux peuvent être manipulés ou entièrement supprimés par l'auteur ou les modérateurs. Cela peut conduire à de faux signaux dans les flux de commentaires utilisés pour l'analyse des sentiments.

Pour faire des prévisions de sentiment fiables, la plate-forme doit enregistrer toutes les données collectées sur une blockchain où elles sont horodatées, créant ainsi un enregistrement immuable pour l'analyse.

Ce processus permettra en outre un back-testing fiable des algorithmes développés par les créateurs sur les plateformes (et les récompensera en conséquence).

Tous les algorithmes d'analyse des sentiments créés par les développeurs sur la plate-forme doivent en outre être horodatés et enregistrés dans une chaîne de blocs pour garantir que seules les futures données Oracle sont utilisées pour la vérification de la notation de l'algorithme des sentiments.

Jeton

Des jetons peuvent être attribués aux propriétaires de sites Web qui fournissent des données démographiques et des commentaires via une API aux analystes utilisant ces flux à des fins d'analyse des sentiments.

Mécanique des jetons

Les jetons remplissent les critères suivants:

  • accorder le droit qui se traduit par une utilisation, un vote / jalonnement ou un accès simple à la plateforme
  • Échange de valeur
  • Péage (paiement à l'utilisation)

Fournisseurs de données

Les opérateurs de sites Web peuvent vérifier leurs sites Web en tant que sources pour la plate-forme via un plugin WordPress ou Javascript pour devenir des sources de données vérifiées (VDS). Une fois la validation terminée, les opérateurs du site Web reçoivent une allocation de jetons de sentiment émis par contrat intelligent à un portefeuille sur la plate-forme (mise initiale). 100% de la mise initiale sont jalonnés immédiatement par un contrat intelligent.

As developers add the VDS to their sentiment algorithms and end users start consuming the resulting sentiment data, tokens from the Initial Stake are being unstaked and released to the account holder.

The total number of CP sources is limited to 100,000 (SourceMax). Should the total number of sources reach 100,000 new sources will be added to a waiting list until existing sources expire. Source expire if they are not being utilized by a developers over a period of 360 days at SourceMax.

Développeurs

Developers familiar with sentiment analysis can deploy algorithms on the platform and choose appropriate CPs to source data from. Developers will receive 5,000 Sentiment Tokens for the deployment of a new algorithm deposit by smart contract into their account.

100% of the initial token allocation is staked and will be released to the developer when consumers subscribe to his sentiment algorithm feed.

Taggers

Any user can earn Tokens by tagging data sources. Every tag must be validated by five other independent taggers on the platform. Each tagging event is therefore rewarded with an average of one token. Each token is staked by smart contract until first consumed by a developers algorithm.

Expected Resource Requirements

  • 6x servers 4 vCPUs, 15 GB memory for Kubernetes Cluster – Analyzer & UI part live.
  • 3x servers 8 vCPUs, 52 GB memory for Crawler DB
  • 13x servers 4 vCPUs, 26 GB memory main DataBase
  • 3x servers 4 vCPUs, 26 GB memory for release environment DataBase where all the testing and QA takes place
  • 18x micro-instances 1 vCPUs, 2 GB memory for Crawler's workers (sufficient to crawl about 50,000 websites)

Requirement calculations on EOS: https://www.eosrp.io/#calc

Décentralisation

To create long-term viability of the platform and stability of the marketplace, the objective should to completely decentralize the platform within a period of no more than 1,500 days of the conclusion of a public token sale, if one should be conducted.



Traduction de l’article de Christian Kameir : Article Original

BlockBlog

Le Meilleur de l'Actualité Blockchain Francophone & Internationale | News, Guides, Avis & Tutoriels pour s'informer et démarrer facilement avec Bitcoin, les Crypto-Monnaies et le Blockchain. En Savoir Plus sur L'Équipe BlockBlog

Commenter cet Article

Commenter cet Article

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Plus dans News

Les Plus Populaires

Acheter des Bitcoin

Acheter des Alt-Coins

Sécuriser vos Cryptos

Vêtements et Produits Dérivés

Top