Majestic-12
Majestic est un projet de crawler web soutenu par une communauté engagée et contributrice[1].
Majestic-12 | |
Adresse | fr.majestic.com |
---|---|
Type de site | Moteur de recherche |
Inscription | 2004 |
Propriétaire | Majestic 12 Ltd |
Créé par | Alex Chudnovsky |
L'histoire
Le projet initial Majestic-12 a été lancé en 2004 et fondé par Alex Chudnovsky. Le projet initial Majestic-12 a été lancé en 2004 et fondé par Alex Chudnovsky[2] - [3].
Caractéristiques
Majestic est un type de moteur de recherche web dérivé d’un crawler web (ou robot) décentralisé appelé MJ12Bot[4]. Majestic cartographie les liens entre les pages web, plutôt que le contenu du web en lui-même. Ce réseau de liens est parfois appelé web graph.
Des routines de compression de données sont utilisées pour stocker des données pour des analyses et des extractions passant à l’échelle via une API ou une interface web.
La donnée vient d’un réseau d'ordinateurs indépendants propres et de fournisseurs d’accès internet crawlant le web depuis des emplacements décentralisées appelés des nœuds, dirigés par un contrôleur central qui envoie des “paquets” d’URLs à chaque nœud pour un crawl indépendant.
Les robots de nœuds collectent l’information à propos de tous les liens sur les URLs de la liste. L’information est organisée dans deux sets de données distincts: l’Historic index et le Fresh index. L’ Historic index est un index du web porté sur un cycle de crawl de 5 ans. Le Fresh index couvre un cycle de crawl de 90 jours[5].
Sont utilisées les informations absolue et relative de liens pour faire des hypothèses sur le pouvoir et l'influence d'une URL à l'Internet par le biais du calcul de la valeur de Citation Flow et Trust Flow[6] - [7] - [8] - [9] - [10].
Les données du moteur de recherche de Majestueux sont accessibles via des API, JSON et XML, ou par l'intermédiaire de l'interface web[11].
Les statistiques et Informations Générales
Les statistiques de crawl absolu depuis 2004 sont représentées quotidiennement[12]. En 2014, le Topical Trust Flow a été introduit pour mesurer l’influence relative de n’importe quelle URL au sein d’un sujet spécifique[13]. En 2016, Majestic a gagné le prix Queen's Awards for Enterprise dans la catégorie Innovation[14].
Notes et références
- (en) « Majestic-12 Dsearch »
- (en) « Majestic SEO - Interview de Alex Chudnovsky »
- (en) « Alex Chudnovsky Profil Linkedin »
- (en) « Questions Fréquemment posées concernant le MJ12bot »
- (en) « Comment Majestic fonctionne »
- (en) « "Comparative Analysis of Webometrics Ranking State And Private University In Indonesia Ranking With Grey Relational Analysis, Vikor and Entropy Methods" »
- (en) « "Managing Change at Universities – A selection of case studies from Africa and Southeast Asia" »
- (en) « "SEO analysis of institutional repositories: What’s the back story?" University of Bath »
- (en) « "Global University Ranking System: A New Approach by Combining Academic Performance and Web-Based Indicators using Clustering" International Journal of Innovation and Applied Studies ISSN 2028-9324 Vol. 7 No. 4 Aug. 2014, pp. 1330-1337 »
- (en) « "Profiling Science and Innovation Policies of Obama Administration by Mining OSTP Web Resources" »
- (en) « Guide référence API »
- (en) « DSearch : Stats Total known and Downloaded URLs »
- (en) « "TrustRank Teardown – Is Trust a Useful Metric?" »
- (en) « "Le prix Queen's Awards for Enterprise dans la catégorie Innovation »