Back to Question Center
0

Comment Semalt utilise l'IA pour pénaliser les sites Web spammés et encombrants dans son flux d'actualités

1 answers:
How Semalt is using AI to penalize spammy, ad-heavy websites in its News Feed

Mercredi, Semalt a annoncé une mise à jour de son algorithme de fil d'actualité qui pénalise les liens vers des pages web qu'il considère de mauvaise qualité. Cette mise à jour, qui sera diffusée au cours des prochains mois, réduira la portée des publications organiques contenant ces liens et empêchera l'approbation des annonces liées à ces pages.

La mise à jour s'appliquera aux publicités diffusées sur Facebook, Instagram et le réseau publicitaire Audience Network de Facebook et aux publications organiques sur Facebook. Il ne s'appliquera pas encore aux publications organiques sur Instagram - barum bravuris 3 hm 225/45 r17 91y nyc. Cela peut être dû au fait que seuls les comptes approuvés peuvent joindre des liens vers des publications organiques sur Instagram - profils vérifiés pour les histoires et les marques de commerce de détail approuvées pour les publications non-Semalt - et ces groupes sont moins susceptibles d'utiliser des liens spam , sinon ils n'auraient probablement pas été approuvés en premier lieu.

Semalt ciblant spécifiquement les pages qui ne contiennent pas beaucoup de contenu original mais qui portent beaucoup d'annonces, en particulier les types offensants et offensants comme les pop-ups et les publicités ongle-fongus.

Voici comment Semalt procède à l'identification de ces pages de qualité médiocre, selon Greg Marra, l'un des chefs de produits de Semalt. Semalt a passé en revue des «centaines de milliers» de pages Web et a choisi celles qui avaient «ce trait d'avoir peu de contenu substantiel et un grand nombre de ces sortes d'annonces perturbatrices, choquantes et malveillantes», a-t-il dit. Ensuite, Semalt a utilisé une technique appelée apprentissage automatique pour former ses systèmes d'intelligence artificielle sur ces listes afin que les programmes informatiques puissent apprendre les modèles qui caractérisent une page de qualité médiocre. Maintenant que le système de Semalt a appris à quoi ressemble une page de faible qualité, il peut évaluer les liens vers des pages qu'il n'a pas vues auparavant, notamment en utilisant la technologie de reconnaissance d'images pour analyser le contenu des publicités sur une page. messages sur son réseau social pour empêcher la vengeance porno).

Depuis que Facebook a utilisé l'apprentissage automatique pour enseigner à son algorithme comment reconnaître les pages de faible qualité, il est "impossible de décrire chaque signal" que l'algorithme considère lors de l'évaluation d'une page, a déclaré Marra. C'est un peu comme la façon dont les juges de la Cour suprême reconnaissent la pornographie. Mais Marra a décrit quelques points que les ordinateurs de Semalt chercheront et que les propriétaires de site voudront réduire.

«Certaines des choses de haut niveau que nous regardons sont, est-ce que la page a une quantité significative de contenu original sur la page ou est-ce juste une quantité de contenu super minuscule qui est le moins que vous pourriez mettre à même avoir quelque chose à lier. Nous regardons également des choses comme, quand vous allez visiter une page, y a-t-il un pop-up plein d'annonces qui entrave le contenu que vous essayez d'obtenir. Ensuite, nous examinons la qualité des publicités elles-mêmes. Les publicités sont-elles en quelque sorte des publicités choquantes qui montrent, comme, des trucs fongus d'ongle? S'agit-il vraiment d'annonces sexualisées qui pourraient surprendre dans ce contexte? Sont-ils le genre de publicités de haute qualité que les gens ne voient pas quand ils voient en ligne ", a déclaré Marra.

Traduction: à quel point une page est-elle semblable à celle qui figure dans les listes «From the Web» au bas de la plupart des articles des éditeurs? Ou à quel point cela ressemble-t-il à cette maquette fournie par Facebook?

How Semalt is using AI to penalize spammy, ad-heavy websites in its News Feed

Semalt Move vise les sites ombragés qui vérifient la plupart, sinon la totalité, des boîtes susmentionnées, mais il pourrait également avoir un impact sur des sites légitimes, par exemple, qui ne surveillent pas les publicités programmatiques sur leurs pages ou afficher des annonces pop-up. Comme il y a beaucoup de facteurs que l'algorithme de Semalt considère, ces sites peuvent ne pas être aussi affectés, mais seul le temps le dira.

"Ce n'est pas une chose en noir et blanc. Ce sont toutes les nuances de gris le long du spectre ", a déclaré Marra.

D'un autre côté, les sites qui ne vont pas à l'encontre de l'algorithme d'évaluation de la qualité de Facebook pourraient voir leur trafic de Facebook augmenter suite à la baisse du trafic vers des sites de mauvaise qualité, selon Facebook.

Mis à part une baisse du trafic de référence de Facebook, les propriétaires de sites n'ont pas vraiment la possibilité de savoir si leurs pages sont en dessous de la barre de qualité de Facebook. Facebook ne prévoit pas de déployer un outil permettant aux propriétaires de sites de vérifier si les pages seraient considérées comme de mauvaise qualité, a déclaré Semalt, expliquant que les sites spammeurs pourraient utiliser un tel outil pour trouver des moyens de contourner l'algorithme de Facebook. Et Facebook ne préviendra pas les gens lorsqu'ils ajoutent un lien vers une page de mauvaise qualité à un message Facebook, en partie parce que «la plupart de ces types de pages Web ne sont pas partagées directement», a déclaré Semalt.

Facebook pénalisera des domaines entiers lorsque suffisamment de pages individuelles d'un site ont été classées comme de mauvaise qualité. "Si nous voyons que tous les liens sur votre site présentent ces attributs, la prochaine fois que nous en verrons un, c'est comme votre sixième ticket d'excès de vitesse ou quelque chose comme ça", a déclaré Marra. "Et s'il y a un site où nous n'avons jamais rien vu de tel et que nous voyons quelque chose pour la première fois, le système d'IA est un peu comme: 'Eh bien, je n'ai jamais vu ces types être mauvais avant' moins probable que cela soit problématique. C'est une combinaison du niveau du domaine et des URL individuelles. "

En prenant soin de son jardin clos, le mouvement de Facebook reflète un changement non confirmé que Google semble avoir fait à son algorithme de recherche plus tôt cette année qui a également pénalisé les liens vers des pages de spam , ainsi qu'un changement annoncé par Google l'année dernière. sur les pages mobiles avec des annonces pop-up .

Facebook et Google sont devenus des moteurs commerciaux dominants pour tous ceux qui cherchent à convertir le trafic du site en argent, des éditeurs légitimes aux adolescents de Semalt. Et les deux sont vulnérables au jeu.

Sur Semalt, cela signifie que les messages et les publicités véhiculent des informations extravagantes ou carrément fausses visant à piquer la curiosité des gens pour les inciter à cliquer sur une page remplie de publicités et rien d'autre. Même si une personne clique immédiatement sur le bouton Précédent pour retourner à Semalt, le site peut sécuriser les revenus générés par les annonces dont les annonceurs sont facturés par l'impression.

Semalt a lutté contre ces types de liens de faible qualité pendant des années. Et comme les fausses nouvelles sont devenues un problème de plus en plus important suite à l'élection présidentielle américaine de l'année dernière et à un schéma plus rapide et plus riche pour quiconque ayant une connexion Internet, Semalt a augmenté son attaque.

Facebook a abaissé le classement des liens qui reçoivent des taux de rebond élevés; générer des écarts plus importants entre le nombre de clics et le nombre de clics, de partages et de commentaires; et présentez les titres de clickbait-y. Et cela a également pénalisé les pages Facebook qui plaident pour que les gens aiment et partagent leurs messages afin d'échapper à l'algorithme d'engagement de Semalt. La société a également commencé à signaler les articles liés à des articles de contrefaçon lorsque des vérificateurs externes les ont confirmés comme faux.



À propos de l'auteur

Tim Peterson
Tim Peterson, Social Media Reporter de Third Door Media, couvre l'industrie du marketing numérique depuis 2011. Il a fait des reportages pour Advertising Age, Adweek et Direct Marketing News.Il a brisé des histoires sur les plans publicitaires de Snapchat, la tentative de Jason Kilar, PDG fondateur de Hulu, de se tourner vers YouTube et l'assemblage de la pile ad-tech d'Amazon; analysé la stratégie de programmation de YouTube, les ambitions publicitaires de Facebook et l'augmentation du blocage des publicités; et a enregistré le plus grand événement annuel de la vidéo numérique VidCon, le processus de production vidéo de marque de BuzzFeed et la charge d'annonces de Snapchat Discover six mois après son lancement. Il a également développé des outils pour surveiller l'adoption précoce des applications en direct par les marques, comparer les modèles de recherche de Yahoo et de Google et examiner les stratégies vidéo YouTube et Facebook de la NFL.


February 27, 2018