Ανάπτυξη Μηχανισμού Βελτιστοποίησης της Θέσης Δικτυακών Τόπων σε Μηχανές Αναζήτησης

choochoopilotInternet and Web Development

Jun 25, 2012 (5 years and 4 months ago)

379 views







Θεςςαλονίκθ
, Μάρτιοσ

201
1

ΑΡΙ΢ΣΟΣΕΛΕΙΟ ΠΑΝΕΠΙ΢ΣΗΜΙΟ ΘΕ΢΢ΑΛΟΝΙΚΗ΢

ΠΟΛΤΣΕΧΝΙΚΗ ΢ΧΟΛΗ

ΣΜΗΜΑ ΗΛΕΚΣΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΤΠΟΛΟΓΙ΢ΣΩΝ

ΣΟΜΕΑ΢ ΗΛΕΚΣΡΟΝΙΚΗ΢ ΚΑΙ ΤΠΟΛΟΓΙ΢ΣΩΝ








Ανάπτυξθ Μθχανιςμοφ
Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν
Σόπων ςε Μθχανζσ Αναηιτθςθσ



Διπλωματικι εργαςία του

Θεμιςτοκλι Μαυρίδθ

ΑΕΜ:

6136



υπό τθν επίβλεψθ του


κ. Ανδρζα Λ. ΢υμεωνίδθ

Λζκτορα


2

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ




3

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

Ευχαριστίες

Αρχικά κα ικελα να ευχαριςτιςω όςουσ
ςυνζβαλλαν ςτθν επιτυχι ολοκλθρωςι αυτισ τθσ
διπλωματικισ εργαςίασ:



Σον κακθγθτι μου, κ.

Ανδρζα ΢υμεωνίδθ, για τθν εμπιςτοςφνθ που

μου

ζδειξε με
τθν ανάκεςι
τθσ, τθν αρωγι κατά τθν εκπόνθςι τθσ και τισ καίριεσ προτάςεισ και
ςυμβουλζσ του
.



Σουσ

γονείσ μου,
Θωμά και ΢τζλλα, και τον αδερφό μου Χάρθ για

τθν

υποςτιριξθ
και τθν βοικεια που μου παρείχαν ςτθν κακθμερινότθτα μου
.



Σουσ φίλουσ μου, για τθν εμψφχωςθ και
τθν
ςυμπαράςταςθ
.




4

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ




5

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

Περίληψη

Οι μθχανζσ αναηιτθςθσ αποτελοφν
πλζον
ζνα από τα πιο ςθμαντικά εργαλεία
για τουσ
χριςτ
εσ

του διαδικτφου. Η ραγδαία εξζλιξι τουσ τθν τελευταία δεκαετία τισ ζχει
καταςτιςει
τισ
πιο ςθμαντικ
ζσ

πθγ
ζσ

αναηιτθςθσ πλθροφορίασ και γνϊςθσ

γενικά
.
Η
κατάταξθ των αποτελεςμάτων
ςε δεδομζνθ
αναη
ιτθςθ πρζπε
ι να
είναι ςυνδεδεμζνθ με
το
είδοσ του ερωτιματοσ του
χριςτθ
, και θ επιτυχία μιασ μθχανισ κακορίηεται από το κατά
πόςο κάποιοσ βρίςκει αυτό που ψάχνει (και όχι κάτι άλλο ςχετικό) γριγορα και εφκολα.
Προφανϊσ θ καλφτερθ κατάταξθ ςτισ μθχανζσ αναηιτθςθσ ςυνε
πάγεται και ζνα ςφνολο
από πλεονεκτιματα ςτουσ δικτυακοφσ τόπουσ. Για το λόγο αυτό
αναπτφχκθκε ο τομζασ του
Search

Engine

Optimization

(
SEO
)
, ο οποίοσ ςτοχεφει ςτθ
ν κατάλλθλθ διαμόρφωςθ τθσ
δομισ και του περιεχομζνου των
δικτυακϊν τόπων
, ϊςτε να είναι δυνα
τι θ
βελτιςτοποίθςθ τθσ κατάταξισ τουσ
ωσ προσ τα αποτελζςματα των μθχανϊν

αναηιτθςθσ
.

Η παροφςα διπλωματικι εργαςία
πραγματεφεται μια
SEO

τεχνικι, θ οποία ςτοχεφει ςτθ
βελτίωςθ του περιεχομζνου ενόσ δικτυακοφ τόπου
. Διαπιςτϊνοντασ πωσ ο χϊροσ τθσ
ςθμαςιολογικισ ανάλυςθσ είχε χρθςιμοποιθκεί ςε μικρό βακμό ςτο πεδίο του
S
ΕΟ,
υιοκετείται μια
ςθμαςιολογικι προςζγγιςθ με τθ χριςθ
Latent

Dirichlet

Allocation

ςε
ςυνδυαςμό με
Gibbs

Sampling
, ϊςτε να αναλυκοφν τα αποτελζςματ
α
των μθχανϊν
αναηιτθςθσ

για δεδομζνεσ λζξεισ
-
κλειδιά
.

΢τα πλαίςια τθσ παροφςασ εργαςίασ γίνεται εκτενισ ανάλυςθ ςτθ βιβλιογραφία, και
παρουςιάηεται ο μθχανιςμόσ που αναπτφχκθκε
για τθν πραγματοποίθςθ ερωτθμάτων ςτισ
μθχανζσ αναηιτθςθσ, τθν αξιολόγθςθ των

αποτελεςμάτων τουσ με τθ χριςθ διαφόρων
μετρικϊν
SEO
, τθν ανάλυςθ του περιεχομζνου των αποτελεςμάτων και τθν εξαγωγι νζου
βελτιςτοποιθμζνου
περιεχόμενο
υ, με ςτόχο τθν καλφτερθ κατάταξθ του δθμιουργθμζνου
ιςτ
ό
τ
ο
που Σεχνολογίασ Λογιςμικοφ του Εργαςτιριου ςτισ μθχανζσ αναηιτθςθσ.


Θεμιςτοκλισ

Μαυρίδθσ
,

Μάρτιοσ

201
1




6

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ




7

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

Abstract

An LDA
-
based mechanism for the
optimization of website

ranking
in
search engines

Search engines are
nowadays
one of the most important
tools for any internet user. The
ir
rapid evolution over the last decade has
transformed
them

into
the most important source
of information and knowledge.
R
anking of search results
on a given query has to be directly
correlated to the user anticipated respo
nse, and for a search engine to be successful, it has
to return the correct results fast and accurately. On the other hand, better ranking in a
search engine result set implies a number of advantages for the websites. This is the main
reason for the flouri
shing
of Search Engine Optimization

(SEO) techniques
,
which ai
m
towards
restructuring or enriching website content, so as optimization on
the ranking
of
websites in relation to search
engine results

is feasible
.

The current
thesis
discusses a SEO mechanism

that focuses on the improvement of website
content.

Having identified that
semantic analysis was
not been widely applied
in the field of
SEO,
a semantic approach is adopted, which uses
Latent Dirichlet Allocation
techniques
coupled
with Gibbs Sampling
in
order to analyze
the results of search engines

based on
given keywords
.


Within the context of the thesis extensive literature review is performed

and the developed
mechanism is presented, which performs
queries to search engines,
evaluates
results
through state
-
of
-
the
-
art
SEO

metrics
,
analyzes results’
content

and
extracts
new
,
optimized

content
. The case study field (terms, context) is that of Software

Engineering.



Themistoklis Mavridis,

March
201
1




8

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ




9

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

Περιεχόμενα


Ευχαριςτίεσ

................................
................................
................................
....................

3

Περίληψη

................................
................................
................................
.......................

5

Abstract

................................
................................
................................
..........................

7

1

Ειςαγωγή

................................
................................
................................
..............

17

1.1

Αντικείμενο τθσ Διπλωματικισ Εργαςίασ

................................
................................

17

1.2

΢τόχοι τθσ Διπλωματικισ

................................
................................
.........................

17

1.3

Δομι τθσ διπλωματικισ

................................
................................
..........................

17

2

Βαςικζσ Τεχνολογίεσ SEO

................................
................................
.......................

19

2.1

Οι μθχανζσ αναηιτθςθσ ςιμερα

................................
................................
.............

19

2.2

Ανάλυςθ τθσ μθχανισ αναηιτθςθσ τθσ
Google

................................
......................

21

2.2.1

Η αρχιτεκτονικι τθσ
Google

................................
................................
............

21

2.2.2

Σο ΢φςτθμα Κατάταξθσ τθσ
Google

................................
................................
.

22

2.2.3

Ο
PageRank

Αλγόρικμοσ

................................
................................
.................

23

2.2.4

Toolbar
PageRank



Ο

πραγματικόσ

PageRank

................................
..............

28

2.3

Ανάλυςθ του γενικότερου χϊρου του
SEO

................................
.............................

30

2.3.1

Κατθγορίεσ Ιςτότοπων και επιχειριςεων

................................
.......................

30

2.3.2

Εςωτερικζσ Αλικειεσ για το
SEO

................................
................................
.....

32

2.4

΢υνολικοί Παράγοντεσ κατάταξθσ

................................
................................
...........

33

3

Βιβλιογραφική επιςκόπηςη και αναφορά ςε υπάρχουςεσ SEO προςεγγίςεισ

.........

43

3.1

Προςεγγίςεισ βαςιςμζνεσ ςτθ δομι των ςυνδζςμων

................................
............

43

3.1.1

Βελτιςτοποίθςθ των μθχανϊν αναηιτθςθσ με τθ χριςθ δεδομζνων κλικ

.....

43

3.1.2

Ο ευφυισ χριςτθσ: Πικανοκρατικόσ ΢υνδυαςμόσ των Πλθροφοριϊν
΢υνδζςμου και Περιεχομζνου ςτον
PageRank

................................
...............................

44

3.1.3

Νζεσ εκδόςεισ του

PageRank

χρθςιμοποιϊντασ εναλλακτικά μοντζλα
δικτυακϊν εγγράφων

................................
................................
................................
......

45

3.1.4

Βελτιςτοποίθςθ τθσ δικτυακισ αναηιτθςθσ με τθ χριςθ δεδομζνων κλικ

....

46

3.1.5

Βελτιςτοποίθςθ τθσ Προ
-
μεταφοράσ Αποτελεςμάτων ςε Δικτυακζσ Μθχανζσ
Αναηιτθςθσ με τθ χριςθ κατακερματιςμζνων δεικτϊν

................................
.................

47

3.1.6

Μία ζρευνα ςτον υπολογιςμό του
PageRank

................................
.................

47

3.1.7

Επζκταςθ του
PageRank
: Μθχανικι εκμάκθςθ για ςτατικι κατάταξθ

..........

48


10

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ

3⸱⸸

剡R歍慳a

䍲慷汥r
: Ζνασ
Crawler

με εγγφθςθ υψθλοφ επιπζδου κάλυψθσ
προςωποποιθμζνου
PageRank

................................
................................
.......................

49

3.1.9

Μεγάλθσ κλίμακασ Εκτίμθςθ και Ανάλυςθ ΢τρατθγικϊν Προςωποποιθμζνθσ
Αναηιτθςθσ

................................
................................
................................
.....................

50

3.2

Προςεγγίςεισ με βάςθ το περιεχόμενο

................................
................................
...

51

3.2.1

Βελτιςτοποίθςθ τθσ Δικτυακισ Αναηιτθςθσ με τθ χριςθ Κοινωνικϊν ΢χολίων

51

3.2.2

Μπορεί θ χριςθ των Κοινωνικϊν ΢ελιδοδεικτϊν να βελτιϊςει τθν Δικτυακι
Αναηιτθςθ;

................................
................................
................................
......................

52

3.2.3

Εξουςιαςτικζσ Πθγζσ ςε ζνα Περιβάλλον Τπερςυνδζςμων

...........................

53

3.2.4

Κατάταξθ ςε πολλαπλά Δεδομζνα

................................
................................
..

53

3.2.5

Προςωποποιθμζνθ Αναηιτθςθ με τθ χριςθ Αυτοματοποιθμζνθσ Ανάλυςθσ
Ενδιαφερόντων και Δραςτθριοτιτων

................................
................................
.............

54

3.2.6

Ευαίςκθτο

ωσ

προσ

Θζματα

PageRank

................................
...........................

55

3.2.7

Αυτόματθ Αναγνϊριςθ των Ενδιαφερόντων του Χριςτθ για
Προςωποποιθμζνθ Αναηιτθςθ

................................
................................
.......................

56

3.2.8

Βελτίωςθ τθσ Προςωποποιθμζνθσ Δικτυακισ Αναηιτθςθσ με τθ χριςθ
Διαφοροποίθςθσ Αποτελεςμάτων

................................
................................
..................

56

3.2.9

Προςωποποιθμζνθ αναηιτθςθ και περιιγθςθ με τθ χριςθ οντολογιϊν

......

57

3.2.10

Προςωποποίθςθ των Τπθρεςιϊν Μθχανισ Αναηιτθςθσ για πιο
Αποτελεςματικι Ανάκτθςθ και Διαχείριςθ τθσ Γνϊςθσ

................................
.................

58

Personalization of Search Engine Services for Effective Retrieval and Knowledge
Management

................................
................................
................................
...................

58

3.2.11

PageRank

χωρίσ Τπερςυνδζςμουσ: Δομικι Ανακατάταξθ με τθ χριςθ
΢υνδζςμων που προκφπτουν από Γλωςςικά μοντζλα

................................
...................

58

3.2.12

Βελτίωςθ τθσ Κατάταξθσ τθσ Δικτυακισ Αναηιτθςθσ με τθν Ενςωμάτωςθ
Πλθροφοριϊν ΢υμπεριφοράσ Χριςτθ

................................
................................
............

59

Improving Web Search Ranking by Incorporating User Behavior Information

...............

59

3.2.13

GOOSE
: Μία ΢τοχοκεντρικι Μθχανι Αναηιτθςθσ με Κοινι Λογικι

...............

60

3.2.14

Βελτίωςθ των Δικτυακϊν Δομϊν με τθ χριςθ Σεχνικϊν Δικτυακισ Εξόρυξθσ
Δεδομζνων

................................
................................
................................
......................

61

3.2.15

TFIDF, LSI, PLSI, LDA, PLDA

................................
................................
..............

61

3.3

Σο υποκείμενο του πειράματοσ

................................
................................
..............

63

4

Οι αλγόριθμοι τησ προτεινόμενησ μεθοδολογίασ

................................
...................

65

4.1

Latent

Dirichlet

allocation


LDA

................................
................................
.............

65

4.1.1

Οριςμοί

................................
................................
................................
............

65


11

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

4⸱⸲

LM䄠
Ανάλυςθ

................................
................................
................................
...

65

4.2

SEOmoz

αλγόρικμοι

................................
................................
................................

70

4.2.1

mozRank

................................
................................
................................
..........

70

4.2.2

mozRank vs PageRank

................................
................................
.....................

73

4.2.3

mozTrust

................................
................................
................................
..........

75

4.2.4

Page
Authority

................................
................................
................................
.

76

4.2.5

Domain Authority

................................
................................
............................

76

4.2.6

΢φγκριςθ των
SEOmoz

αλγορίκμων

................................
................................

76

4.3

Normalized Google Distance

................................
................................
...................

78

5

Η προτεινόμενη μεθοδολογία

................................
................................
................

81

5.1

Ανάλυςθ βαςικϊν ςταδίων μεκοδολογίασ

................................
.............................

83

5.1.1

Πραγματοποίθςθ ερωτθμάτων ςτισ μθχανζσ αναηιτθςθσ

.............................

83

5.1.2

Αξιολόγθςθ και Επιλογι αποτελεςμάτων αναηιτθςθσ

................................
..

84

5.1.3

Ανάλυςθ Ιςτοςελίδων των Αποτελεςμάτων και Εξαγωγι Περιεχομζνου

......

86

5.1.4

΢θμαςιολογικι ανάλυς
θ

................................
................................
.................

87

5.1.5

Δθμιουργία Νζων Ερωτθμάτων και Διαδικαςία Επιλογισ αυτϊν

..................

88

5.1.6

Ζλεγχοσ ΢φγκλιςθσ

................................
................................
...........................

89

5.1.7

Μορφι ειςόδου εφαρμογισ

................................
................................
...........

90

6

Πειράματα και τεκμηρίωςη

................................
................................
...................

93

6.1

Τλοποίθςθ Πειραμάτων

................................
................................
..........................

93

6.2

Αποτελζςματα Πειραμάτων

................................
................................
....................

94

6.2.1

Αξιολόγθςθ αποτελεςμάτων ενδεικτικϊν πειραμάτων
................................

101

7

Συμπεράςματα


Μελλοντική εργαςία

................................
................................
.

103

7.1

΢φνοψθ


΢υμπεράςματα

................................
................................
.....................

103

7.2

Μελλοντικι Εργαςία

................................
................................
.............................

103

Παράρτημα
A

................................
................................
................................
..............

105

A
.1 Ανάλυςθ αλγορίκμων που κα μποροφςαν να χρθςιμοποιθκοφν ςτθν αξιολόγθςθ
αποτελεςμάτων

................................
................................
................................
.................

105

A
.1.1
SSR

................................
................................
................................
........................

105

A
.1.2 SPR

................................
................................
................................
........................

106

A.2
Δθμιουργία

Ιςτότοπου

Software Engineering Center of AUTH

................................
..

107

Βιβλιογραφία

................................
................................
................................
..............

111



12

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ




13

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

Λίστα Εικόνων

Εικόνα 1
-
Αρχιτεκτονικι τθσ Google *2+

................................
................................
...................

21

Εικόνα 2
-
Γράφοσ ζξι ιςτοςελίδων

................................
................................
...........................

26

Εικόνα 3
-
Λζξθ κλειδί και κζςθ ςτο Title Tag

................................
................................
...........

41

Εικόνα 4
-
Λζξεισ κλειδία ςτα <
H
1>
tags

................................
................................
...................

41

Εικόνα 5
-
Alt text

................................
................................
................................
......................

42

Εικόνα 6
-
Γραφικι αναπαράςταςθ του μοντζλου LDA. Σο εξωτερικό ορκογϊνιο
αντιπροςωπεφει τα ζγγραφα και το εςωτερικό τθν επαναλαμβανόμενθ επιλογι κεμάτων
και λζξεων μζςα ςε ζνα ζγγραφο.

................................
................................
..........................

67

Εικόνα 7
-
Απεικόνιςθ τθσ κατανομισ
Dirichlet

τριϊν μεταβλθτϊν (μ1,μ2,μ3)

.......................

68

Εικόνα 8
-

Ζνα παράδειγμα πυκνότθτασ ςε κατανομζσ
p
(
w

κ,β) για
LDA

με τρεισ λζξεισ και
τζςςερα κζματα.

................................
................................
................................
.....................

68

Εικόνα 9

mozRank

ςε λογαρικμικι κλίμακα

................................
................................
..........

72

Εικόνα 10
-
mozRank

(5
-
7) ςε λογαρικμικι κλίμακα

................................
................................

72

Εικόνα 11
-
Domain

mozRank

ςε λογαρικμικι κλίμακα

................................
...........................

73

Εικόνα 12
-
Toolbar

PageRank

-

mozRank

................................
................................
................

74

Εικόνα
13
-
Toolbar

PageRank



Domain

mozRank

................................
................................
..

75

Εικόνα 14
-
Βαςικά ςτάδια τθσ μεκοδολογίασ

................................
................................
.........

81

Εικόνα 15
-
Πραγματοποίθςθ ερωτθμάτων ςτισ μθχανζσ αναηιτθςθσ. Σα αποτελζςματα
εξάγονται και ςε διάφορουσ τφπουσ δεδομζνων:

................................
................................
..

83

Εικόνα 16
-
Αξιολόγθςθ και Επιλογι αποτελεςμάτων αναηιτθςθσ

................................
.........

85

Εικόνα 17
-
Ανάλυςθ Ιςτοςελίδων των Αποτελεςμάτων και Εξαγωγι Περιεχομζνου
.............

86

Εικόνα 18
-
΢θμαςιολογικ
ι ανάλυςθ

................................
................................
........................

87

Εικόνα 19
-
Δθμιουργία Νζων Ερωτθμάτων και Διαδικαςία Επιλογισ αυτϊν

........................

88

Εικόνα 20
-
Ζλεγχοσ ΢φγκλιςθσ

................................
................................
................................
..

89

Εικόνα 21
-

SEC Auth Homepage

................................
................................
............................

108

Εικόνα

22
-
SEC Auth Main Menu

................................
................................
...........................

109





14

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ

Λίστα
Γραφημϊτων

Γράφθμα 1
-
Καμπφλθ Toolbar
PageRank

ςε ςχζςθ με Πραγματικό
PageRank

με βάςθ=2

....

28

Γράφθμα 2
-

Καμπφλθ Toolbar
PageRank

ςε ςχζςθ με Πραγματικό
PageRank

με βάςθ=5.5

29

Γράφθμα 3
-
΢ε επίπεδο ςελίδασ (΢χετικοί με λζξεισ
-
κλειδιά) παράγοντεσ

............................

34

Γράφθμα 4
-
΢ε επίπεδο ςελίδασ (μθ ςχετικοί με λζξεισ
-
κλειδιά) παράγοντεσ

.......................

35

Γράφθμα 5
-
΢ε επίπεδο ςελίδασ δθμοτικότθτασ ςυνδζςμων παράγοντεσ

.............................

35

Γράφθμα 6
-
΢ε επίπεδο ιςτότοπου (ςχετικοί με ςυνδζςμουσ) παράγοντεσ

...........................

36

Γράφθμα 7
-
΢ε επίπεδο

ιςτότοπου (μθ
-
ςχετικοί με ςυνδζςμουσ) παράγοντεσ

.....................

36

Γράφθμα 8
-
Βαςιςμζνοι ςτα μζςα κοινωνικισ δικτφωςθσ παράγοντεσ

................................
.

37

Γράφθμα 9
-
Παράγοντεσ Αρνθτικισ κατάταξθσ

................................
................................
.......

37

Γράφθμα 10
-
Παράγοντεσ που επθρεάηουν αρνθτικά τθν αξία ενόσ εξωτερικοφ ςυνδζςμου

................................
................................
................................
................................
.................

38

Γράφθμα 11
-
Δεδομζνων Χριςθσ παράγοντεσ

................................
................................
........

38

Γράφθμα 12
-
Geo
-
Targeting
Παράγοντεσ

................................
................................
................

39

Γράφθμα 13
-
Ολικοί Παράγοντεσ*73+

................................
................................
......................

39

Γράφθμα 14
-
Επαναλθπτικοί αλγόρικμοι παρόμοιοι με το
PR

................................
...............

77

Γράφθμα 15
-
΢υχνισ χριςθσ μζτρα μθ παρόμοια με
PR

................................
.........................

77

Γράφθμα 16
-
Μζτρα για εκτίμθςθ ιςτότοπων/
domain

ςε ςφγκριςθ με
PageRank

Homepage

................................
................................
................................
................................
.................

78

















15

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

Λίστα Πινϊκων

Πίνακασ 1
-
΢τοιχεία των μεγαλφτερων μθχανϊν αναηιτθςθσ
-

Πθγι: comScore, Ιανουάριοσ
2011, U.S. Total Core Search

................................
................................
................................
...

20

Πίνακασ 2
-
΢χζςθ Toolbar
PageRank


Πραγματικό
PageRank

(με βάςθ=2)

..........................

28

Πίνακασ 3
-
΢χζςθ
Toolbar

PageRank



Πραγματικό
PageRank
(με βάςθ=5.5)

.......................

29

Πίνακασ 4
-
Κακαριςμόσ ειδικϊν χαρακτιρων

................................
................................
.........

86

Πίνακασ 5
-
Παράμετροι
JGibbLDA

................................
................................
...........................

88

Πίνακασ 6
-
Ζξοδοι
JGibbLDA

................................
................................
................................
....

88

Πίνακασ 7
-
Εξ’ οριςμοφ Παράμετροι ειςόδου εφαρμογισ

................................
......................

91

Πίνακασ 8
-

Πίνακασ Πειραμάτων 1

................................
................................
........................

95

Πίνακασ 9
-

Πίνακασ Πειραμάτων 2

................................
................................
........................

99





16

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ





17

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

1

Ειςαγωγή

1.1

Αντικείμενο τθσ Διπλωματικισ Εργαςίασ

Οι μθχανζσ αναηιτθςθσ του παγκόςμιου ιςτοφ ζχουν εξελιχκεί ςε
μεγάλο βακμό

τθν
τελευταία δεκαετία και πλζον αποτελοφν ζνα από τα πιο χριςιμα

εργαλεία για το
ν

κάκε
είδουσ χριςτθ του διαδικτφου. Από το 2004 και ζπειτα
,

οι μθχανζσ

αναηιτθςθσ

ζχουν
ενςωματϊςει πλθκϊρα
μετρικϊν
ςτουσ μθχανιςμοφσ
τουσ,

ϊςτε να παράγουν πιο
ικανοποιθτι
κά αποτελζςματα αναηθτιςεων. Παράλλθλα με αυτι τθν εξζλιξθ των μθχανϊν,
εξελίχκθκε και ο τομζασ τθσ βελτιςτοποίθςθσ των
ιςτότοπων

ςε ςχζςθ με τισ μθχανζσ
αναηιτθςθσ.

΢ταδιακά, με τθν ενςωμάτωςθ των προςωποποιθμζνων αποτελεςμάτων από
τισ μθχανζσ, τθν ζκρθξθ

ςτα μζςα κοινωνικά δικτφωςθσ και τθν επιρροι τουσ ςτισ μθχανζσ
,

και με τθν δθμιουργία των αναηθτιςεων πραγματικοφ χρόνου, ο τομζασ του
S
earch

Engine

Optimization

(
SE
O
)

ζχει εξελιχκεί ςε ζνα
ν

τομζα με πολλαπλζσ προςεγγίςεισ και ιδιαίτερα
ςθμαντικι αξία λόγω τθσ επιρροισ του ςτα αποτελζςματα των μθχανϊν αναηιτθςθσ.

1.2

΢τόχοι τθσ Διπλωματικισ

Ο ςκοπόσ
τθσ
παροφςασ Διπλωματικισ Εργαςίασ είναι θ εξαγωγι πλθροφορίασ από τα
αποτελζςματα των μθχανϊν ανα
ηιτθςθσ. Ωσ τελικό

προϊόν

παρζχεται ζνασ μθχανιςμόσ για
τθν δθμιουργία περιεχομζνου
,

βελτιςτοποιθμζνου ωσ προσ τισ ςελίδεσ αποτελεςμάτων των
μθχανϊν αναηιτθςθσ.

Αρχικά, ωσ ςτόχοσ τζκθκε θ

ανάλυςθ

όλων

των εμπλεκόμενων εννοιϊν, μεκόδων

και
τεχνικϊν που

αφορ
οφν το
SEO
, με παράλλθλθ αποςαφινιςθ τθσ ςχετικισ ορολογίασ. ΢τθ
ςυνζχει
α παρατίκεται μια επιςκόπθςθ τθσ ερευνθτικισ δραςτθριότθτασ
ςτο χϊρο και θ
αναγνϊριςθ των κυρίαρχων κατθγοριϊν αυτϊν.

Βαςικόσ
ςτόχοσ
τθσ παροφςασ διπλωματικισ εργαςίασ ιταν
θ επιλογι μ
ιασ μεκόδου που
κα οδθγοφςε ςτθ δθμιουργία
ενόσ μοντζλου

με
διαφορετικι

προςζγγιςθ ςτο κζμα του
SEO

ςε ςχζςθ με
τισ
υπ
άρχουςεσ,
και ςυνακόλουκα θ υλοποίθςθ μιασ εφαρμογισ που κα
ενςωμάτωνε το μοντζλο

αυτό
.

Διαπιςτϊνοντασ πωσ ο χϊροσ τθσ ςθμαςιολογικισ ανάλ
υςθσ
είχε ςυνδυαςτεί ςε μικρό βακμό με τον χϊρο του
SEO
,

επιλζχκθκε μία ςθμαςιολογικι
προςζγγιςθ τθσ ανάλυςθσ των αποτελεςμάτων των μθχανϊν αναηιτθςθσ. Σελικά,
πραγματοποιικθκαν πειράματα ςε ζνα ενδεικτικό ςετ δεδομζνων ειςόδου, ϊςτε να
διαπιςτωκεί θ εκπλι
ρωςθ των προςδοκιϊν μασ από τθν εφαρμογι.

1.3

Δομι τθσ διπλωματικισ

΢το
π
ρϊτο Κεφάλαιο


πραγματοποιείται μία ειςαγωγι ςτον αντικείμενο τθσ διπλωματικισ
εργαςίασ και ςτθ βαςικι τθσ διάρκρωςθ.

΢το
δ
εφτερο Κεφάλαιο

αναλφεται θ ζννοια του
SEO
,

οι μθχανζσ αναηιτθςθ
σ και τρόποσ λειτουργίασ τουσ, κακϊσ και οι παράγοντεσ που
επθρεάηουν το
SEO
.

΢το
τ
ρίτο Κεφάλαιο παρατίκενται οι υπάρχουςεσ προςεγγίςεισ όςον
αφορά το
SEO

και πραγματοποιείται ανάλυςθ αυτϊν και του βακμοφ χρθςιμότθτάσ τουσ.

΢το
τ
ζταρτο Κεφάλαιο
πραγματοποιείται λεπτομερισ ανάλυςθ των αλγορίκμων
,
ςυμπεριλαμβανομζνων και
αυτϊν ςθμαςιολογικισ ανάλυςθσ,

που
υιοκετεί
θ
παροφςα

18

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ

διπλωματικι, ενϊ ς
το
π
ζμπτο Κεφάλαιο αναλφεται το μοντζλο και περιγράφεται θ
υλοποίθςι των επιμζρουσ ςτοιχείων του
.

΢το
ζ
κτο Κ
εφάλαιο, παρουςιάηονται τα
αποτελζςματα τθσ εφαρμογισ που προζκυψαν από ενδεικτικά πειράματα. Γίνεται
εκτίμθςθ των αποτελεςμάτων και ςφγκριςθ τουσ με τισ αρχικζσ προςδοκίεσ κεωρθτικοφ
επιπζδου.

΢το
ζ
βδομο και τελευταίο κεφάλαιο παρατίκενται τα τελικά ςυμπε
ράςματα
ςχετικά με τθν εργαςία και οι πικανζσ μελλοντικζσ επεκτάςεισ.

΢το Παράρτθμα Α, αναλφονται αλγόρικμοι που κεωρικθκαν ότι μποροφν να αποτελζςουν
μελλοντικζσ επεκτάςεισ τθσ υπάρχουςασ εφαρμογισ
,

κακϊσ και θ δθμιουργία του
ιςτότοπου
Software

Engineerin
g

Center

του
εργαςτθρίου ΕΠΤ του
τμιματοσ ΗΜΜΤ.


19

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

2

Βαςικέσ Τεχνολογίεσ
SEO

Σο

SEO

ςθμαίνει

search

engine

optimization

και αναπαριςτά τθ μζκοδο που ςτοχεφει ςτθ
βελτίωςθ τ
θ
σ

κατάταξθ ενόσ
ιςτ
ό
τ
ο
που

ςτισ μθχανζσ αναηιτθςθσ

[
1
]
. Η διαδικαςία αυτι
είναι ιδιαίτερα ςφνκετθ και εξαρτάται κατά μεγάλο βακμό από τουσ μθχανιςμοφσ ςάρωςθσ
και αξιολόγθςθσ των μθχανϊν αναηιτθςθσ. Για το λόγο αυτό,
είναι ςθμαντικό να
πραγματοποιθκεί

πρϊτα μία ανάλυςθ των
πιο ιςχυρϊν
μθχανϊν αναηιτθςθσ.

2.1

Οι μ
θχανζσ αναηιτθςθσ ςιμερα



Google
:
Αδιαμφιςβιτθτα, θ
Google

αποτελεί τον «θγζτθ» των μθχανϊν
αναηιτθςθσ. Λαμβάνει τθν μεγαλφτερθ κίνθςθ, αποτελεί τθ μοναδικι μθχανι
αναηιτθςθσ με καταχϊριςθ ςτο λεξικό, προςφζρει υπθρεςίεσ θλεκτρονικοφ
ταχυδρομείου, χάρτεσ, θ
μερολόγιο,
feed

readers
, εργαλεία
διαχείριςθσ

(
web

master

tools
) και
υπθρεςία
ανάλυςθσ

ςτατιςτικϊν
των
ιςτότοπων

(
web

analytics
).
Διακζτει μενοφ με πλθκϊρα επιλογϊν αναηιτθςθσ που περιλαμβάνουν νζα,
βίντεο, εικόνεσ,
blog

κλπ.
H

Google

ουςιαςτικά
ορίηει τθν «μόδα» ςτισ μθχανζσ
αναηιτθςθσ. Αυτι κακόριςε το
Link

Popularity

ωσ ιδιαίτε
ρα ςθμαντικό

παράγοντα
,
ενςωμάτωςε

πρϊτθ

ςτο
ςφ
ςτθμά

τθσ
τθ
ν

εμφάνιςθ διαφόρων ειδϊν
αποτελεςμάτων (πχ.
κείμενο,

εικόνα

και βίντεο ςτθ πρϊτθ ςελίδα
αποτελεςμάτων
μιασ ανα
ηιτθςθσ) και ζκεςε τθν θλικία ενόσ
ιςτότοπου

ωσ
παράγοντα ςτθ
κατάταξθ.

Σο 2005
ξεκίνθςε
το
Google

Analytics
, μια δωρεάν και εφρωςτθ εφαρμογι
ανάλυςθσ τθσ κίνθςθσ ενόσ
ιςτότοπου

, που αποτελεί τθ
ν

πιο ςθμαντικι εξζλιξθ
ςτο
SEO

τα
τελευταία

χρόνια
,

αφοφ μετακίνθςε το ενδιαφζρον ςτισ μετατροπζσ
(
Conversions
) από τθν κατάταξθ
[
1
]
.

΢το τζλοσ του 2010
ειςάγει
ςτον χϊρο των
μθχανϊν αναηιτθςθσ το
Google

Instant
, το οποίο είναι μία βελτίωςθ τθσ
αναηιτθςθσ
που
επιτρζπει τθν εμφάνιςθ των αποτελεςμάτων κατά τ
θν διάρκεια
τθσ πλθκτρολόγθςθσ.



Yahoo
!
:

Μία από τισ παλαιότερεσ μθχανζσ αναηιτ
θςθσ και θ δεφτερθ ςε κατάταξθ

δθμοφιλίασ
. Αρχικά,
θ
Yahoo
!
ξεκίνθςε ωσ διαδικτυακόσ κατάλογοσ άλλων
ιςτοςελίδων οργωμζνοσ με μία ιεραρχία. ΢τα τζλθ του 1990
μετατράπθκε
ςε ζνα
p
ortal

(δι
α
δικτυακι πφλθ)
με κφριο χαρακτθριςτικό τθ
ν

αναηιτθςθ. Αρχικά, το
web

crawling
, θ αποκικευςθ και θ ανάκτθςθ των δεδομζνων δεν γινόταν από τθν
Yahoo
!.

Σο 2001 το ευρετιριο αναηθτιςεων τθσ υποςτθριηόταν από τθν
Inktomi

και
αργότερα από τθν
Google
. Σο 2004 θ
Yahoo
!
ζγινε ανεξάρτθτθ
,

και ςτισ 29 Ιουλίου
του 2009
ανακοίνωςε
μία ςυμφωνία με τθν
Microsoft
,
ςφμφωνα με τθν
οποία

θ
μθχανι
αναηιτθςθσ

Bing
,
κα υποςτθρίηει τθν
Yahoo
!
.



Bing

(
πρϊθν
Live

Search
,
Windows

Live

Search
,
MSN

Search
)
:

Η μθχανι αναηιτ
θςθσ
τθσ
Microsoft

που
διαφθμίςτθκε

ωσ μία «μθχανι αποφάςεων». Παρουςιάςκθκε
ςτισ 28
Μαΐου

του 2009 από τον
CEO

τθσ
Microsoft

Steve

Ballmer

ςτθ διάςκεψθ
All

Things

Digital

ςτο
San

Diego
,
USA
.
Η
preview

ζκδοςθ κυκλοφόρθςε ςτθ 1 Ιουνίου

20

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ

του 2009 και θ πλιρθσ λειτουργίασ τθσ μθχανισ ξεκίνθςε ςτισ 3 Ιουνίου του 2009.
Κατθγορικθκε από τθν
Google

ότι αντιγράφει τα αποτελζςματά τθσ
(
https://se
archengineland.com/google
-
bing
-
is
-
cheating
-
copying
-
our
-
search
-
results
-
62914
)
,

το οποίο θ
Bing

διζψευςε ςτο ςυνζδριο
Farsight

2011

(
http://bigthink.com/series/62
).



Ask
.
com
:

Μια εδραιωμζνθ μθχανι αναηιτθςθσ που
εςτιάηει ςε καινοτομίεσ ςτο
περιβάλλον διεπαφισ
και το
περιεχό
μενό

τθσ. Κάποια ξεχωριςτά χαρακτθριςτικά
τθσ αποτελοφν θ προβολι των αποτελεςμάτων ςε 3 ςτιλεσ
(εξαλείφοντασ
το
scrolling
)
, θ δυνατότθτα προεπιςκόπθςθσ χωρίσ τθν αλλαγι ςελίδασ και θ πλιρθσ
εν
ςωμάτωςθ των διαφόρων επιπρόςκετων επιλογϊν αναηιτθςθσ ςτα
αποτελζςματα.
Επίςθσ, ςθμαντικό εργαλείο αποτελεί το
Ask

Eraser
,
το οποίο δίνει
τθν δυνατότθτα ςε κάποιον χριςτθ να ςβιςει τα
δεδομζνα

αναηιτθςισ

του
από

τθν βάςθ δεδομζνων τθσ
Ask
.
com

[
1
]
.



AOL
:

Χρθςιμοποιεί τθ βάςθ δεδομζνων τθσ
Google

για τθν εμφάνιςθ
αποτελεςμάτων

και δεν αποτελεί κά
τι ιδιαίτερο ςτον τομζα του
SEO
,
παρόλο που
ζχει το
1
.
6
% τθσ ςυνολικισ κίνθςθσ αναηθτιςεων

(Πθγι:

comScore
,
Ιανουάριοσ

2011
,

U
.
S
.
Total

Core

Search

[96]
)
.

΢τον Πίν
ακα 1 δίνονται ςυγκεντρωτικά ςτοιχεία για τισ 4 βαςικζσ μθχανζσ αναηιτθςθσ.

Πίνακασ
1
-
΢τοιχεία των μεγαλφτερων μθχανϊν αναηιτθςθσ

-

Πθγι: comScore, Ιανουάριοσ 2
011,
U.S. Total Core Search

Search
Engine

Googl
e

Sites

Yahoo!

Sites

Microsoft Sites

Ask

Network

Ποςοςτό κίνθςθσ
αναηθτιςεων

6
5
.
6
%

1
7
.
9
%

1
2
.
8
%

3.
1
%

Πθγι επιρροισ
οργανικϊν
αποτελεςμάτων

Open Directory

Yahoo! Directory

Open Directory

Blinkx

(για τα
αποτελζςματα βίντεο)

Σρόποι καταχϊρθςθσ

ιςτότοπου



XML

sitemap



Αναμονι για
εφρεςθ από
«
robot
»



Επί πλθρωμι
καταχϊρθςθ ςτο
Yahoo
!
Directory



XML

sitemap



Αναμονι για
εφρεςθ από
«
robot
»



Φόρμα
καταχϊριςθσ
url



XML

sitemap



Αναμονι για
εφρεςθ από
«
robot
»



XML

sitemap



Αναμονι για εφρεςθ
από «
robot
»

Pay
-
Per
-
Click
Τπθρεςίεσ

Google AdWords

Yahoo! Search
Marketing (YSM)

Microsoft Ad Center

Ask Sponsored Listings
(ASL) ,
βαςιςμζνο

ςτο

Google AdWords

΢θμαντικζσ Τπθρεςίεσ

Goggle Webmaster
Tools, Google
Analytics

Yahoo! Go , Alibaba

Gatineu web
analytics,

Ενςωμάτωςθ

του

Facebook

Ask

Eraser
,
ειδικζσ

επιλογζσ

αναηιτθςθσ


Κφρια πθγι
αποτελεςμάτων

Robot Crawler

Robot Crawler

Robot Crawler

Robot Crawler





21

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

2.2

Ανάλυςθ τθσ
μθχανισ αναηιτθςθσ τθσ
Google

Η
Google

είναι θ
κυρίαρχθ

μθχανι αναηιτθςθσ και πρωτοπόροσ ςτισ αλλαγζσ των
μθχανϊν

αναηιτθςθσ,
οπότε είναι ςθμαντικό να γίνει μια λεπτομερισ
ανάλυςι
τθσ.

2.2.1

Η αρχιτεκτονικι τθσ
Google


Εικόνα
1
-
Αρχιτεκτονικι τθσ Google

[2]


Σο προθγοφμενο ςχιμα αποτελεί μια πολφ ικανοποιθτικι προςζγγιςθ του
μθχανιςμοφ τθσ

Google
. Αρχικά, οι
crawler

s
τθσ
Google
, δθλαδ
ι τα «
robots
»

ι «
spiders
»,
διαβάηουν τισ
ιςτοςελίδεσ ςφμφωνα με τθν λίςτα
URL

που δζχονται από τον
URL

server
.
O
ι ςελίδεσ που
διαβάηουν αποςτζλλονται ςτον
Store

Server
, ο οποίοσ τισ ςυμπιζηει και τισ αποκθκεφει ςτο
Repository
. Κάκε νζα ςελίδα αποκτά ζνα μοναδικό
Doc

ID

μόλισ το
URL

τθσ αναλυκεί. Σα
Doc

ID
s

των ιςτοςελίδων αποκθκεφονται ςτθ βάςθ δεδομζνων
Doc

Index

ενϊ τα
URL
s
, τα

22

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ

οποία ςχθματίηουν ηεφγθ με τα
Doc

ID
s
, αποκθκεφ
ονται ςτθ βάςθ δεδομζνων
Links
.
Ο

URL

Resolver

είν
αι
υπεφκυνο
σ

για τθ
χαρτογράφθςθ

των
link
s

και των
Doc

ID
s
.

Οι διαδικαςίεσ δεικτοδότθςθσ πραγματοποιοφνται από τον
Indexer

και τον
Searcher
,
με τον
πρϊτο να ςχθματίηει το κανονικό ευρετιριο
(
forward

index
)
και τον δεφτερο το αντίςτροφο
(
inverse

index
).

To

κανονικό ευρετιριο ςχθματίηεται με τθν εξισ διαδικαςία
:

o

Indexer

παίρνει τισ
ιςτοςελίδεσ από

το

Repository
, τισ αποςυμπιζηει και τισ αναλφει ϊςτε να ςχθματίςει μια
λίςτα λζξεων που αναφζρονται ςτο αρχείο και
παράγει τθν βάςθ δεδομζνων
Lexicon
. Η
λίςτα
περιζχει επίςθσ πλθροφορίεσ για τθ κζςθ των λζξεων μζςα ςτο αρχείο, το μζγεκοσ
τθσ γραμματοςειράσ κατά προςζγγιςθ και το αν είναι κεφαλαία τα γράμματα ι όχι. Αυτι θ
ςυλλογι πλθροφοριϊν για μία λζξθ ονομάηεται «
hit
». Μόλισ δθμιουργθκοφν όλα τα
hit
s

για όλεσ

τισ λζξεισ τθσ ιςτοςελίδασ που αναλφεται
,
ο
Indexer

τα αποςτζλλει ςτα
Barrels

και
επαναλαμβάνει τθ
ν

ίδια διαδικαςία για όλεσ τισ ιςτοςελίδεσ ςτο
Repository
.

Ο
Sorter

παίρνει τα
hit
s

από τα
Barrels

και δθμιουργεί ζνα αντίςτροφο
ευρετιριο.
Αντιςτοιχίηει

κάκ
ε
λζξθ με μία λίςτα αρχείων ςτα οποία εμφανίηεται
,

κακϊσ και πλθροφορίεσ για το πλικοσ
των εμφανίςεων, τθ κζςθ, το μζγεκοσ τθσ γραμματοςειράσ και το αν είναι κεφαλαία τα
γράμματα ι όχι
.

O

Indexer

δθμιουργεί επίςθσ το αρχείο
Anchor
,
το οποίο

περιζχει πλθροφορίεσ

(κείμενο
anchor
, από που προζρχεται ο ςφνδεςμοσ και που οδθγεί) για τουσ ςυνδζςμουσ που
εμφανίηονται ςτθν ιςτοςελίδα που αναλφεται.
Σο αρχείο
Anchor

αναλφεται από τον
URLs

Resolver
, ο οποίοσ μετατρζπει τα
ςχετικά
url
s

(
relative

urls
)
ςε απόλυτα
url

(
absolute

urls
)
και
DocID
s

και παράγει αντιπροςωπευτικζσ ειςόδουσ για τθ βάςθ δεδομζνων
Links
,
ϊςτε
να υπολογιςτεί το
PageRank

τθσ
κάκε ςελίδασ.

Σο
Dump

Lexicon

χρθςιμοποιεί τθ βάςθ δεδομζνων
Lexicon

και τθ λίςτα λζξεων που
δθμιουργεί ο
Sorter

για να δθμιουργιςει ζνα νζο

lexicon
,

ϊςτε να
χρθςιμοποιθκεί

από τον
Searcher

ςε ςυνδυαςμό με το αντίςτροφο ευρετιριο και τα
PageRank
s
,
ϊςτε να αποκρικεί
ςτα ερωτιματα των χρθςτϊν

[2]
.

2.2.2

Σο
΢φςτθμα

Κατάταξθσ τθσ
Google

H

Google διατθρεί πολφ
περιςςότερεσ πλθροφορίεσ ςχετικά με τα ζγγραφα από το
διαδίκτυο

ςε ςχζςθ με τισ τυπικζσ

μθχανζσ αναηιτθςθσ.

Κάκε
hit

list

περιλαμβάνει κζςθ,

γραμματοςειρά, και πλθροφορίεσ
κεφαλαιοποίθςθ
σ
.

Επιπλζον,

λαμβάνει υπ’ όψθ

τα
hit
s

από το κείμενο
anchor

και τθ τιμι του
PageRank

για το ςυγκεκριμζνο αρχείο
.

Ο
ςυνδυαςμόσ όλων αυτϊν των πλθροφοριϊν

για τθ δθμιουργία
κατάταξθσ

είναι αρκετά
δφςκολοσ
.

Η
Google

ς
χεδίαςε

τθ ςυνάρ
τθς
θ

κατάταξθ
σ ζτςι ϊςτε κανζνασ

παράγοντασ

να
μθν

μπορεί να ζχει πολφ μεγάλθ επιρροι.
A
σ εξετάςουμε

τθν απλοφςτερθ περίπτωςθ
:

ζνα
ερϊτθμα

με μία

λζξθ

για αναηιτθςθ
.

Για να καταταχκεί ζνα ζγγραφο με ζνα ερϊτθμα μίασ
λζξεωσ, θ Google εξετάηει τα
hit

list
s

του

κάκε
ζγγραφο
υ

για αυτι τθ λζξθ.

H

Google

κεωρεί
ότι
κάκε χτφπθμα

μπορεί

να είναι
διαφορετικοφ

είδουσ

(τίτλοσ, κείμενο
anchor
, URL, απλό
κείμενο

με

μεγάλθ γραμματοςειρά, απλό κείμενο
με
μικρι γραμματοςειρά
,

κτλ
). Κάκε
είδοσ ζχει το δικό του βάροσ. Σα βάρθ για κάκε είδοσ ςυνκζτουν
ζνα διάνυςμα
το
οποίο


23

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

κατατάςςεται ςφμφωνα με το
είδοσ
.

Η

Google

μετρά τον αρικμό των
hit
s

του

κά
κε τφπου
ςτθ λίςτα των
hit
s
.


Ζπειτα,

κάκε άκροιςμα μετατρζπεται ςε μια μεταβλθτι «άκροιςμα
-
βάροσ» (
count
-
weights
)
.

Σα ακροίςματα
-
βάρθ

αυξάνονται γραμμικά
ςφμφωνα με τα
ακροίςματα αρχικά
,
αλλά

πάνω από ζνα οριςμζνο αρικμό

ακροιςμάτων δεν ζχουμε
ανάλογθ αφξθςθ.

Παίρνουμε
το εςωτερικό γινόμενο του διανφςματοσ ακροιςμάτων
-
βαρϊν
με το διάνυςμα τφπων
-
βαρϊν και υπολογί
ηουμε μία
IR

βακμολογία

(
Information

Retrieval

score
)

για το ζγγραφο
.

Σζλοσ, θ βακμολογία
IR

ςυνδυάηεται με το
PageRank

για να δϊςει
μια τελικι κατάταξθ για το ζγγραφο.

Για μία πολλϊν λζξεων αναηιτθςθ

θ κατάςταςθ είναι πιο περίπλοκθ.

Σϊρα πολλαπλζσ

hit

lists

πρζπει να ςαρωκ
οφν
,

ζτςι ϊςτε τα
hit
s

που
ςυμβαίνουν κοντά
ι
μζςα
ςε ζνα ζγγραφο
να ζχουν μεγαλφτερθ βαρφτθτα από αυτά που ςυμβαίνουν μακριά
.

Σα
hit
s

από τισ
πολλαπλζσ
hit

lists

ςυνδυάηονται

ζτςι ϊςτε

τα κοντινά
hit
s

να ομαδοποιθκοφν μαηί
.

Για
κάκε ομάδα
hit
s

υπολογίηεται ζνασ βακμόσ εγγφτθτασ.
Η εγγφτθτα εξαρτάται από το πόςθ
είναι θ απόςταςθ μεταξφ των
hit
s

ςτο ζγγραφο (ι κείμενο
anchor
)
,

αλλά
ταξινομοφνται ςε
δζκα

διαφορετικισ

αξία
σ «
bins
»
που κυμ
αίνονται από απόλυτθ ταφτιςθ με τθν ζκφραςθ
μζχρι καμία ςυςχζτιςθ
.

Σα ακροίςματα

υπολογίηονται
όχι
μόνο για κάκε είδοσ

hit
, αλλά για
κάκε ηεφγοσ
είδουσ

και

εγγφτθτα
σ
.

Κάκε ηεφγοσ
είδουσ

και εγγφτθτασ
ζχει
ζνα
type
-
prox

βάροσ
.

Σα ακροίςματα
μετατρζπονται
ςε
βάρθ
μζτρθςθσ
(
count
-
weights
)
και δίνουν

το
εςωτερικό γινόμενο αυτϊν και των
type
-
prox

βαρϊν για να υπολογιςκεί το
IR
.

Όλοι αυτοί
οι αρικμοί και οι

μιτρεσ μπορεί όλα να εμφανιςτοφν με τα αποτελζςματα αναηιτθςθσ
χρθςιμοποιϊντασ μια ειδικι

λειτουργία απ
α
ςφαλμάτωςθσ
.

Αυτζσ οι εμφανίςεισ

ζχουν

αποδειχκεί ιδιαίτερα χριςιμεσ ςτθν

επίδοςθ του

ςυςτιματοσ κατάταξθσ

τθσ
Google

[3]
.

2.2.3

Ο
PageRank

Αλγόρικμοσ

Η ςθμαςία του

αλγορίκμου

PageRank

είναι εμφανισ από

τθν ανάλυςθ τθσ αρχιτεκτονικισ
τθσ μθχανισ αναηιτθςθσ τθσ
Google

που ζγινε παραπάνω
. Ο αλγόρικμοσ

αναπτφχκθκε από
τουσ ιδρυτζσ τθσ
Google

Lawrence

Page

και
Sergey

Brin

και

χρθςιμοποιείται για τον
κακοριςμό τθσ κζςθσ του κάκε ςυνδζςμο
υ

ςτθ ςελίδα αποτελεςμάτων αναηιτθςθσ.
Ουςιαςτικά ο
PageRank

αποτελεί τον πυρινα του ςυςτι
μα
τοσ

κατάταξθσ.

H

βαςικι ιδζα του αλγορίκμου είναι πωσ αν ζνα ικανοποι
θτικό πλικοσ ςθμαντικϊν
ιςτοςελίδων οδθγοφν ςε μία ιςτοςελίδα τότε αυτι θ ιςτοςελίδα είναι ςθμαντικι.

Ο αλγόρικμοσ
PageRank

κατατάςςει

τουσ
ιςτότοπουσ

ανάλογα με
:



τθ ςχετικότθτ
ά
τουσ με τθν τουσ όρουσ αναηιτθςθσ από τον χριςτθ



το πόςο ςθμαντικό
σ

κεωρείται
κάκε
ιςτότοποσ

[4]

Η Google χρθςιμοποιεί το
ν

PageRank

για να εξετάςει ολόκλθρθ τθ δομι ςυνδζςεων του
Παγκόςμιου Ιςτοφ και
να κακορίς
ει ποιεσ ςελίδεσ είναι οι πιο ςθμαντικζσ. ΢τθ ςυνζχεια,
διενεργεί μια ανάλυςθ
αντιςτοίχθςθσ

υπερ
-
κειμζνου, για να κακορίςει ποιεσ ςελίδεσ είναι
ςυναφείσ με τθ ςυγκεκριμζνθ αναηιτθςθ. ΢υνδυάηοντασ τθ ςυνολικι ςπουδαιότθτα και τθ
ςυνάφεια για το ςυγκεκριμζνο ερϊτθμα, θ Google μπορεί να κατατάξει ςτισ πρϊτεσ κζςεισ

24

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ

τα πιο ςυναφι και αξιόπιςτα αποτε
λζςματα.

΢θμαντικά ςθμεία αναφοράσ για τον
PageRank

αποτελοφν τα εξισ:



Η τεχνολογία
PageRank

πραγματοποιεί αντικειμενικι μζτρθςθ τθσ
ςπουδαιότθτασ ιςτοςελίδων, λφνοντασ μια εξίςωςθ με περιςςότερεσ από 500
εκατομμφρια μεταβλθτζσ και 2 εκατομμφρια όρουσ. Αντ
ί να
μετράει τισ άμεςεσ
ςυνδζςεισ, ο

PageRank

ερμθνεφει μια ςφνδεςθ από τθ ΢ελίδα
A

ςτθ ΢ελίδα
B

ωσ
ψιφο για τθ ΢ελίδα
B

από τθ ΢ελίδα
A
.

Ο

PageRank

αξιολογεί τθ ςπουδαιότθτα
μιασ ςελίδασ ανάλογα με τον αρικμό ψιφων που λαμβάνει.



Ο
PageRank

λαμβάνει, επίςθ
σ,

υπόψθ τθ ςπουδαιότθτα κάκε ςελίδασ που
ψθφίηει, κακϊσ οι ψιφοι από οριςμζνεσ ςελίδεσ κεωροφνται ότι ζχουν
περιςςότερθ αξία, και ζτςι προςδίδουν μεγαλφτερθ αξία ςτθ ςυνδεδεμζνθ
ςελίδα. Οι ςθμαντικζσ ςελίδεσ λαμβάνουν υψθλότερθ βακμολογία
PageRank

και
εμφ
ανίηονται ςτθν κορυφι των αποτελεςμάτων αναηιτθςθσ. Η τεχνολογία τθσ
Google χρθςιμοποιεί τθ ςυλλογικι γνϊςθ του Παγκόςμιου Ιςτοφ για να κακορίςει
τθ ςπουδαιότθτα τθσ ιςτοςελίδασ. Δεν υπάρχει πουκενά ανάμειξθ του
ανκρϊπινου παράγοντα ι ζλεγχοσ των αποτελεςμ
άτων, και για αυτό το λόγο οι
χριςτεσ εμπιςτεφονται το Google ωσ πθγι αντικειμενικϊν πλθροφοριϊν που δεν
διαμορφϊνουν επί πλθρωμι.



Η

μθχανι αναηιτθςθσ τθσ Google αναλφει
,

επίςθσ,

το περιεχόμενο των ςελίδων.
Ωςτόςο, αντί να ανιχνεφει απλά για κείμενο ςτθ ςε
λίδα (το οποίο μπορεί να
ελζγχεται από τουσ εκδότεσ μζςω
meta
-
tag
s
), θ τεχνολογία τθσ Google αναλφει
ολόκλθρο το περιεχόμενο τθσ ςελίδασ κακϊσ και παράγοντεσ ςτισ
γραμματοςειρζσ, τισ υποδιαιρζςεισ και τθν ακριβι κζ
ςθ κάκε λζξθσ. Η Google
αναλφει
,
τζλοσ,
το

περιεχόμενο γειτονικϊν ιςτοςελίδων για να διαςφαλίςει ότι τα
εμφανιηόμενα αποτελζςματα είναι τα πιο ςυναφι για το ερϊτθμα του χριςτθ

[5]
.

Μ
ια απλοποιθμζνθ ζκδοςθ του
PageRank

μπορεί να

είναι θ παρακάτω ζκφραςθ

PR(u) = c




















o
ποφ
u

είναι μία ιςτοςελίδα,
PR
(
u
)

είναι θ τιμι του
PageRank

για τθν ιςτοςελίδα
u
,
Β(
u
)

είναι ζνα ςετ
ιςτοςελίδων

που οδθγοφν ςτθν

u
,
Ν
u

είναι το πλικοσ των
εξερχόμενων
ςυνδζςμων τθσ ςελίδασ και το
c

είναι μία τιμι

που
χρθςιμοποιείται για
τθν
κανονικοποί
θςθ του α
ποτελζςματοσ.

Από τθ παραπάνω εξίςωςθ παρατθροφμε ότι αν δφο ιςτοςελίδεσ «δείχνουν» θ μία ςτθν
άλλθ και δεν ζχουν άλλουσ εξερχόμενουσ ςυνδζςμουσ και μία
από

αυτζσ ζχει ζνα
ειςερχόμενο ςφνδεςμο τότε κα αποκτιςουν
βακμολογία
PageRank
,
αλλά δεν κα το
διανζμουν
, κάτι που
μπορεί να επθρεάςει αρνθτικά τα αποτελζςματα. Σο φαινόμενο αυτό
ονομάηεται «
Rank

Sink
»
.

Σ
ο
PageRank

μίασ ιςτοςελίδασ είναι ουςιαςτικά θ πικανότθτα
ζνα τυχαίο άτομο που περιθγείται ςτο διαδίκτυο και
επιλζγει
τυχαίουσ ςυνδζςμουσ
,

να
φτάςει ςτθν ςυγκεκριμζνθ ιςτοςελίδα. Θα πρζπει να λθφκεί επίςθσ υπ’
όψθ

το γεγονόσ
ότι
το άτομο
αυτό μπορεί
να πλθκτρολογιςει το
URL

τθσ ςελίδασ
απευκείασ. Όποτε απόλυτο
Rank

Sink

πρακτικά δεν υφίςταται.


25

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

Σο παραπάνω ςκεπτικό μασ οδθγεί ςτον παρακάτω τ
φπο

PR
(
u
) = (1
-
α
)

+
α



















Οποφ
α

είναι
ζνασ
αποκαρρυντικόσ

παράγοντασ
,

ο οποίοσ ςυνικωσ κεωρείται ότι λαμβάνει
τθν τιμι
0.85 και αντιπροςωπεφει τθν πικ
ανότθτα ζνα τυχαίο άτομο να
ακολουκιςει τθ
δομι των ςυνδζςμων
, ενϊ
το
1
-
α

αποτελεί τθν πικανότθτα να μεταβεί ςε μία άλλθ
ιςτοςελίδα
πλθκτρολογϊντασ

το
URL
.

Λόγω του μεγζκουσ του διαδικτφου απαιτείται να γίνουν επαναλθπτικοί υπολογιςμοί
,

ϊςτε
να
επιλυκεί

το ςφςτθμα των διςεκατομμυρίων εξιςϊςεων που προκφπτουν. Όςο πιο
μεγάλο το
α
, τ
όςο πιο αργι είναι θ ςφγκλιςθ
,

αλλά όςο πιο μικρό
το
α
,

τόςο λιγότερο
πραγματικά είναι τα αποτελζςματα. Ακόμθ και πολφ μικρζσ μεταβολζσ του
α

επθρεάηουν
ςθμαντικά τα αποτελζςματα του
PageRank

και για αυτό τον λόγο είναι ςθμαντικό να
επιλεχκεί ςωςτά

[2]
.

2.2.3.1

Αναλυτική προςζγγιςη του
PageRank

Σο αρχικό μοντζλο του
PageRank

χρθςιμοποιεί τθ
δομι

υπερςυνδζςμων του διαδικτφου
ϊςτε

να δθμιουργιςει μια Μαρκοβιανι αλυςίδα με
ζνα
primitive
,
δθλαδι μθ υποβιβάςιμο
και μθ αρνθτικό,

πίνακα πικανοτιτων μετάβαςθσ
P

με ςτοιχεία


τα οποία εκφράηουν τθ
πικανότθτα μετάβαςθσ από τθν κατάςταςθ


ςτθν


με ζνα βιμα
.
Επίςθσ,

κεωροφμε το

ςτατικό διάνυςμα


του οποίου τα ςτοιχεία
π
j

περιγράφουν

τθν πικανότθτα να βρεκεί θ
διαδικαςία ςτθν κατάςταςθ
j
ςε κάποια
μ
ακρινι

χρονικι ςτιγ
μ
ι
.

Για

το
διάνυςμα


ιςχφουν οι 2 παρακάτω ιδιότθτεσ
:

π
j

=


























To

ότι θ αλυςίδα είναι μθ υποβιβάςιμθ εξαςφαλίηει ότι

το





διάνυςμα του οποίου όλα τα
ςτοιχεία ζχουν άκροιςμα 1
,
γνωςτό και ωσ διάνυςμα
PageRank
,

υπάρχει.
Είναι γνωςτό πωσ
θ εφαρμογι τθσ μεκόδου
δφναμθσ

ςε ζνα
primitive

πίνακα κα ςυγκλίνει ςε αυτό το
ςτατικό
διάνυςμα.

Μποροφμε να αναπαραςτιςουμε τθν δομι του διαδικτφου με ζνα γράφο του οποίου οι
κόμβοι είναι οι ιςτοςελίδεσ και οι κλάδοι οι υπερςφνδεςμοι.
Για παράδειγμα ζνασ γρ
άφοσ
για 6 ιςτοςελίδεσ κα μποροφ
ςε να είναι ο παρακάτω

(Εικόνα 2)
.



26

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ


Εικόνα
2
-
Γράφοσ ζξι ιςτοςελίδων


Ο πίνακασ που προκφπτει για τον παραπάνω γράφο είναι
:


Σο πρόβλθμα που προκφπτει

με τθ χριςθ τθσ δομι
σ

υπερςυνδζςμων του διαδικτφου είναι
πωσ υπάρχουν κόμβοι
(
όπωσ ο κόμβοσ 2
)

που δ
εν ζχει εξερχόμενουσ ςυνδζςμουσ. ΢
υνεπϊσ
όλθ θ δεφτερθ ςειρά του
P

ζχει μθδεν
ικά
,

οπότε

ο
P

δεν είναι ςτοχαςτικόσ.

Μία λφςθ ςτο
παραπάνω πρόβλθμα αποτελεί θ αντικατάςταςθ όλων των μθδενικϊν γραμμϊν
0
T

με






,
όπου


είναι ζνα διάνυςμα γραμμισ με όλα τα ςτοιχεία μονάδεσ και


είναι
θ τάξθ του
πίνακα.
Με αυτι τθ μζκοδο ο πίνακασ


̅

που προκφπτει είναι ο εξισ
:


Παρόλο αυτά, θ παραπάνω αλλαγι δεν μασ εξαςφαλίηει τθν φπαρξθ του ςτατικοφ
διανφςματοσ τθσ μαρκοβιανισ αλυςίδασ


.
Λόγω τθσ φφςθσ του, το διαδίκτυο δθμιουργεί
μία υποβιβάςιμθ μαρκοβιανι αλυςίδα, δθλαδι δεν μποροφμε από κάκε κόμβο να
μεταβοφμε ςε οποιονδιποτε άλλο.
Η αλλαγι που μπορ
οφμε να πραγματοποιιςουμε ϊςτε
ο



να είναι μθ υποβιβάςιμοσ και ςτοχαςτικόσ είναι θ δθμι
ουργία ενόσ πίνακα


̿

ωσ εξισ

:


27

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011


όπου








και







.
Αυτόσ ο κυρτόσ ςυνδυαςμόσ του ςτοχαςτικοφ πίνακα

̅

και του ςτοχαςτικοφ

πίνακα διαταραχισ
Ε

μασ εξαςφαλίηει πωσ ο
πίνακασ

̿

είναι
ςτοχαςτικόσ και μθ υποβιβάςιμοσ και κατά ςυνζπεια
primitive

[6]
.

2.2.3.2

Ο

αποθαρρυντικόσ
παράγοντασ

α

Είναι φανερό πωσ ο
αποκαρρυντικόσ
παράγοντασ
α

είναι ιδιαίτερα ςθμαντικόσ για τα
αποτελζςματα του
PageRank
.

Ο λόγοσ που το α επιλζχκθκε να ζχει τθν τιμι
α
=0.85

είναι
πωσ ζτςι ο
PageRank

είναι αρκετά αντιπροςωπευτικόσ τθσ
πραγματικισ δομισ ςυνδζςμων
του διαδικτφου και ταυτόχρονα δεν είναι αςτακισ
.

Ζχει αποδειχκεί ότι για τιμζσ μεγαλφτερεσ από αυτιν ζχουμε πιο αργι ςφγκλιςθ τθσ
μεκόδου δφναμθσ ςτο διάνυςμα
PageRank
.
Για τθ τιμι 0.85 χρειαηόμαςτε 114
επαναλιψεισ για
επίπεδο

α
νεκτικότθτασ ςφγκλιςθσ






ϊςτε να επιτευχκεί θ
ςφγκλιςθ
,

ενϊ για
α
=
0.99
,
1833 επαναλιψεισ. Λόγω του τεράςτιου μεγζκουσ του δικτφου θ
κάκε επανάλθψθ μετράει
,

οπότε θ διαφορά είναι πολφ μεγάλθ

[6]
.

2.2.3.3

Το διάνυςμα εξατομίκευςησ



Μία βαςικι αλλαγι ςτα παραπάνω είναι ότι το





ζχει αντικαταςτακεί από τθν
Google

με
το




,
που αποτελεί ζνα διάνυςμα εξατομίκευςθσ
,
και θ διαφορά που ειςάγει είναι
πωσ οι πικανότθτεσ ζνασ χριςτθσ να μεταφερκεί απευκείασ ςε ζνα άλλο κόμβο
(telepor
ting) δεν είναι

ομοιόμορφα κατανεμθμζνεσ
,

αλλά κάκε φορά που ο χριςτθσ
πραγματοποιεί
teleporting

ακολουκεί

τθ
ν

κατανομι πικανοτιτων που δίνεται ςτο


για να
μεταβεί ςε μία άλλθ ιςτοςελίδα.

Η
Google

διατθρεί πολλά διαφορετικά



για διάφορεσ ομάδεσ χρ
θςτϊν που ζχει
δθμιουργιςει βάςει

των διαδικτυακϊν τουσ ςυνθκειϊν. Αυτι είναι και θ μζκοδ
οσ που
εφαρμόηει ϊςτε να δθμιουργιςει το προςωποποιθμζνο ςφςτθ
μα
PageRank
ing
. Η ουςία
του όλου εγχειριματοσ είναι θ δθμιουργία ενόσ



για το



του κάκε χριςτθ

[6
]
.

2.2.3.4

Ανανζωςη του διανφςματοσ
PageRank

H

Google

ανανεϊνει το

διάνυςμα
PageRank

κάκε μινα και ςφμφωνα με λεγόμενα
εκπροςϊπου
τθσ,

το διάνυςμα του προθγοφμενου μινα δεν χρθςιμοποιείται ςτθ
δθμιουργία του νζου
,

αφοφ ζγιναν ζρευνεσ και δεν απζφερε αποτελζςματα θ χριςθ του
παλαιοφ διανφςματοσ ςτθ μζκοδο δφναμθσ.

Ζχουν γίνει διάφορεσ προςπάκειεσ
ϊςτε

να επιλυκεί το πρόβλθμα τθσ ανανζωςθσ του
διανφςματοσ. Η πρϊτθ ζγινε
από

τουσ
Chien
,
Dwork
,
Kumar

και
Sivakumar
, οι
οποίοι
δ
θμιοφργθςαν ζνα αλγόρικμο
που
παρείχε ζνα γριγορο και προςεγγιςτικό
PageRank

για
τισ ανανεϊςεισ τθσ δομισ ςυνδζςμων του διαδικτφου. Η λογικι του αλγορίκμου ιταν ο

28

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ

ςχθματιςμόσ ενόσ
μικροφ

γράφου ο οποίοσ περιείχε ζνα μικρό κομμάτι του διαδικτφου
γφρ
ω από τισ αλλαγζσ και όλο το υπόλοιπο διαδίκτυο να αντιμετωπίηεται
ωσ

ζνασ κόμβοσ.
Ζπειτα
,

υπολόγιηαν
το
PageRank

διάνυςμα αυτοφ του μικροφ γράφου και
μετζφεραν
τα
αποτελζςματα ςτον αρχ
ικό και πολφ πιο μεγάλο γράφο
[6]
.

2.2.4

Toolbar

PageRank



Ο

π
ραγματικόσ

PageRank

Μζχρι

τϊρα αναφερόμαςταν με τον όρο
PageRank

ςτθ
ν

πραγματικι βακμολογία του
αλγορίκμου

PageRank
.

Ωςτόςο, ςυνθκίηεται
ο όροσ
PageRank

να αναφζρεται
ςτθ
βακμολογία του
Toolbar

PageRank
. Ο
Toolbar

PageRank

αποτελεί μια κλίμακα με ακζραιεσ
τιμζσ από 1

μζχρι 10, θ οποία ακολουκεί λογαρικμικι κατανομι.

Πρζπει να

ςθμειωκεί,
όμωσ, ότι
μόνο θ
Google

γνωρίηει τθν βάςθ τθσ κατανομισ.

Αν, για παράδειγμα θ βάςθ
ιταν το 2, τότε κα είχαμε τα παρακάτω
:

Πίνακασ
2
-
΢χζςθ Toolbar

PageRank



Πραγματικό

PageRank

(με βάςθ=2)

Toolbar
PageRank

Πραγματικόσ
PageRank

0

1


2

1

2


4

2

4


8

3

8


16

4

16


32

5

32


64

6

64


128

7

128


256

8

256


512

9

512


1024

10

1024 +



Γράφθμα
1
-
Καμπφλθ Toolbar
PageRank

ςε ςχζςθ με Πραγματικό
PageRank

με βάςθ=2


Ενϊ
,

αν θ βάςθ είναι το 5.5 τότε
:

0
200
400
600
800
1000
1200
0
2
4
6
8
10
12
Πραγματικόσ
PageRank

Σ
oolbar PageRank

Βάςθ κατανομισ = 2


29

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011


Πίνακασ
3
-
΢χζςθ
Toolbar

PageRank



Πραγματικό
PageRank

(με βάςθ=5.5)

Toolbar
PageRank

Πραγματικόσ
PageRank

0

1


6

1

6


30

2

30


166

3

166


915

4

915


5033

5

5033


27681

6

27681


152244

7

152244


837339

8

837339


4605367

9

4605367


25329516

10

25329516 +



Γράφθμα
2
-

Καμπφλθ Toolbar
PageRank

ςε ςχζς
θ με Πραγματικό
PageRank

με βάςθ=5.5


Είναι

προφανζσ ότι θ τιμι τθσ βάςθσ ζχει ςθμαντικό ρόλο ςτθ διαμόρφωςθ των τιμϊν

του
Tool
bar

PageRank
.

Παρόλο αυτά, ανεξαρτιτου βάςθσ,
ιςχφουν

τα παρακάτω ςχετικά με τισ
τιμζσ του
Toolbar

PageRank

και αυτζσ του πραγματικοφ
PageRank
:



Κάκε τιμι του
Toolbar

PageR
ank

αντιςτ
οιχεί ςε ζνα μεγάλο εφροσ τιμϊν του
πραγματικοφ
PageRank
.

Αυτό ςθμαίνει πωσ μπορεί δφο ιςτοςελίδεσ με ίδια τιμι
του
Toolbar

PageRank

να ζχουν μεγάλθ διαφορά ςτθ
ν

πραγματικι
PageRank

τιμι

τουσ
, ενϊ δφο ιςτοςελίδεσ με
μικρι διαφορά ςτθν
τιμι
Toolbar

PageRank
, να
ζχουν κοντινζσ πραγματικζσ τιμζσ
PageRank
.



Κάκε τιμι του
Toolbar

PageRank

είναι εκκετικά μεγαλφτερθ από τθν
προθγοφμενι

τθσ. ΢υνεπϊσ, θ αφξθςθ τθσ τιμισ του
Toolbar

PageRank

μιασ ιςτοςελίδασ από 6 ςε
7 είναι πιο δφςκολθ από ότι από 2 ςε 3.



O
ι τιμζσ του
Toolbar

PageRank

δεν ανανεϊνονται ςυχνά. Αν και θ
Google

ανανε
ϊνει ςυχνά τισ τιμζσ του πραγματικοφ
PageRank

τθσ κάκε ιςτοςελίδασ για
χριςθ ςτον
αλγόρικμό

τθσ, οι τιμζσ του
Toolbar

PageRank

ανανεϊνονται κάκε 3 με
4 μινεσ

[4]
.

0
5000000
10000000
15000000
20000000
25000000
30000000
0
2
4
6
8
10
12
Πραγματικόσ

PageRank

Toolbar PageRank

Βάςθ Κατανομισ = 5.5


30

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ

΢υνοψίηοντασ, κάποιοσ μπορεί να πει τα εξισ για τον
PageRank
:



Ο
PageRank

είναι ακόμθ ζνα μζτρο ςθμαντικότθτασ
, αφοφ θ
Google

χρθςιμοποιεί
και άλλα μζτρα για τθν διαμόρφωςθ τθσ κατάταξθσ των αποτελεςμάτων



Ο
PageRank

ακόμθ δεν υπολογίηει τθ ςχετικότθτα
, αφοφ

βαςίηεται αποκλειςτικά
ςτθν δομι ςυνδζςμων



Οι ιςτοςελίδεσ δεν ζχουν τθ δυνατότθτα «ψιφου» του εαυτοφ τουσ



Κάκε ιςτοςελίδα ζχει τθ δυνατότθτα μίασ μόνο ψιφου για μία άλλθ ιςτοςελίδα

2.3

Ανάλυςθ του
γενικότερου χϊρου του
SEO

Σο
SEO

ε
ίναι το ςφνολο τον διαφόρων ενεργειϊν που μπορεί κάποιοσ να πραγματοποιιςει
ϊςτε να αυξιςει το πλικοσ τον επιςκεπτϊν ενόσ
ιςτότοπου

μζςω

των μθχανϊν
αναηιτθςθσ. Αυτζσ οι ενζργειεσ περιλαμβάνουν
ζνα ευρφ φάςμα ενεργειϊν,
από τ
θν

πραγματοπο
ίθςθ

αλλαγ
ϊν

ςτα
κείμενα του
ιςτότοπου

ι ςτον
html

κϊδικα
,

μζχρι τ
θν

πραγματοπο
ίθςθ

ζρευνα
σ

ςτουσ ιςτότοπουσ

τον ανταγωνιςτϊν.

To

SEO

δεν είναι οφτε διαφιμιςθ
,

οφτε
PR
,

αν και περιλαμβάνει ςτοιχεία και από τα δφο.

Κάκε επιχείρθςθ ζχει κάποιουσ ςτόχουσ και για αυτό τον λόγο

είναι ςθμαντικό το
SE
Ο να
μθν επικεντρϊνεται μόνο ςτο
ν

ιςτότοπο

αλλά και ςτουσ ςτόχουσ τθσ επιχείρθςθσ.

Επίςθσ,
ςθμαντικό ςτοιχείου του
SEO

είναι
θ αφξθςθ του τ
θ
σ

επιςκεψιμότθτα
σ

του
ιςτότοπου
, με
τθν απαίτθςθ
οι επιςκζπτεσ να είναι ςτοχευμζνοι
,

ϊςτε αυτι

θ αφξθςθ να οδθγεί ςε
επικυμθτά από τθν εταιρεία ι τον φορζασ
αποτελζςματα.

΢θμαντικό βιμα μετά τον κακοριςμό του είδουσ των επιςκεπτϊν του
ιςτότοπου

αποτελεί ο
κακοριςμόσ του όρου
conversion

(μετατροπι)
,

δθλαδι τθσ

επικυμθτισ ενζργειασ που
εκτελεί ζνασ επιςκζπτθσ πάνω ςτθ ςελίδα
.

Επόμενο ςθμαντικό ςτάδιο είναι
ο οριςμόσ των

ςελίδ
ων που είναι επικυμθτό

οι επιςκζπτεσ του ιςτότοπου

να βλζπουν περιςςότερο (
top



priority

pages

). Αυτζσ οι ςελίδεσ κα πρζπει να αποτελοφν
τισ
landing

pages


entry

pages
)
,

δθλαδι τισ ςελίδεσ ςτισ οποίεσ

οι επιςκζπτεσ κα πθγαίνουν ςτον ιςτότοπο

μζςω των
μθχανϊν αναηιτθςθσ.

΢θμαντικό ςτοιχείο του
SEO

είναι θ καταγραφι των αποτελεςμάτων
,

ϊςτε να
υπάρχει θ
δυνατότθτα βελτιςτοποίθςθσ των

ενερ
γειϊν
ςτο
ν

ιςτότοπο
. Η καταγραφι των
αποτελεςμάτων βοθκά ς
τθν αναγνϊριςθ των ενεργειϊν

που
ζχουν τα επικυμθτά
αποτελζςματα,
ςτθ δθμιουργία
αποδεικτικ
ϊν

ςτοιχεί
ων

τθσ δουλει
άσ

κ
αι
ςτθ διαμόρφωςθ
ςωςτισ

εικόνα
σ

των αλλαγϊν των μθχανιςμϊν των μθχανϊν αναηιτθς
θσ
[
1
]
.

2.3.1

Κατθγορίεσ

Ιςτότοπων και επιχειριςεων

Λόγω των διαφορετικϊν χαρακτθριςτικϊν κάκε επιχείρθςθσ
,

ζχουν οριςκεί οι παρακάτω
κατθγορίεσ
ιςτότοπων

οι οποίεσ ζχουν τα πλεονεκτιματα και τισ προκλιςεισ τουσ όςον
αφορά το
SEO

[
1
]
:

Β2Β:
Business
-
to
-
Business



Πλεονεκτιματα:


31

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

o

΢υγκεκριμζνο
κοινό
και πιο εφκολοσ προςδιοριςμόσ
ιςτότοπων

που
ανταποκρίνονται ςε αυτό

o


Τψθλισ αξίασ
Conversions

λόγω

τθσ ιδιαίτερα υψθλισ αξίασ κάκε νζου πελάτθ

o

Περιεχόμενο με μεγάλο όγκο κειμζνου το οποίο είναι ιδιαίτερα ςθμαντικό για
τισ μθχανζσ αναηιτθςθσ.



Προκλιςεισ:

o


Μικρόσ
ό
γκοσ πλθροφοριϊν για εκτίμθςθ τθσ καμπάνιασ
SEO

o


Δυςκολία ςτθν απόκτθςθ ςυνδζςμων (
linkabil
i
ty
)

B2C: Business
-
to
-
Customer



Πλεονεκτιματα :

o

Περιεχόμενο παραγόμενο από τουσ χριςτεσ (
User

g
enerated

c
ontent
)

o

Εφκολθ διαπίςτωςθ τθσ αποτελεςματικότθτασ τθσ καμπάνιασ και τθσ αξίασ των
o
nline

πωλιςεων



Προκλι
ςεισ:

o

Μθ αναμενόμενοσ
α
νταγωνιςμόσ ςτισ μθχανζσ Αναηιτθςθσ

o

Conversion
π
ροβολϊν

ς
ελίδων

(
Page view conve
rsion
)

o

Μθ ιδιαίτερα καταρτιςμζνο με το
internet

κοινό

Με
γάλοσ Οργανιςμόσ



Πλεονεκτι
ματα:

o

Μεγάλοσ προχπολογιςμόσ και υπάρχουςα υποδομι
marketing

o

Πλθκϊρα
landing pages

o

Βοικεια από
PPC

(
pay

per

click
) μθχανζσ αναηιτθςθσ

o

Οποιαδιποτε ενζργεια του οργανιςμοφ αποτελεί νζο και προςελκφει
επιςκζπτεσ



Προκλιςεισ:


o

Εςωτερικι γραφε
ιοκρατία για οτιδιποτε αφορά τον ιςτότοπο

o

΢υντιρθςθ του
ιςτότοπου

λόγω τθσ πολυπλοκότθτάσ του

Μικρόσ Οργανιςμόσ




Πλεονεκτιματα:

o

Λιγότερθ γραφειοκρατία

o

Φιλικότερο και πιο οικείο πρόςωπο

o

Δυνατότθτα ξεκινιματοσ από το μθδζν



Προκλιςεισ:

o

Μικρόσ προχπολογιςμόσ

o

Ζλλειψθ διακζςιμου χρόνου

Brick
-
and
-
Mortar

(Επιχειριςεισ με φυςικι υπόςταςθ πζρα από
online
)



Πλεονεκτιματα:

o

Εφικτόσ ςτόχοσ

o

Σοπικι αναηιτθςθ

Blogs



Πλεονεκτιματα:


32

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ

o

Φιλικό για δθμιουργία
link

περιβάλλον (
link
-
friendly

environment
)

o

Δυνα
τότθτα Προςωπικισ Επαφισ



Προκλιςεισ:

o

Ιδιαίτερθ προςοχι ςτο φφοσ και το περιεχόμενο

o

Βελτιςτοποίθςθ του κάκε
post

o

Μετακίνθςθ του
domain

του
blog

Web Designer



Πλεονεκτιματα :

o

Εςωτερικι γνϊςθ



Προκλιςεισ :

o


Μικρι χρονικι περίοδοσ για εκτίμθςθ τθσ καμπάνιασ

Μθ
κερδοςκοπικόσ οργανιςμόσ



Πλεονεκτιματα :

o

Linkability

o

Απλι αρχιτεκτονικι του
ιςτότοπου

o

Μικρότεροσ ανταγωνιςμόσ από
PPC

(
pay

per

click
)



Προκλιςεισ :

o

Εςωτερικά κζματα του οργανιςμοφ

2.3.2

Εςωτερικζσ Αλικειεσ για το
SEO

Οι μθχανζσ αναηιτθςθσ δεν εμφανίηουν
ομοιογενείσ ομάδεσ αποτελεςμάτων.

Εμφανίηουν αποτελζςματα τα οποία προζρχονται από διάφορεσ πθγζσ που αναλφονται
παρακάτω

[1]
:

1.

Robot
: Ο βαςικόσ τρόποσ
crawling

των μθχανϊν αναηιτθςθσ
γίνεται μζςω
robot
s

ι
spider
s
,
λογιςμικό με ςτόχο να
μαηεφει πλθροφορίεσ
για το
ν

ιςτότοπο

και
να
τισ
επιςτρζφει ςτθ μθχανι για να αναλυκοφν. Ο τρόποσ που λειτουργεί το
robot

είναι
παρόμοιοσ με το μυρμιγκι που αναηθτεί τροφι μζςω διαδρομϊν. Η τροφι είναι
κείμενο
HTML

και οι διαδρομζσ ςφνδεςμοι
HTML
. ΢υνεπϊσ είναι ςθμαντικό να
υπάρχει νζο
HTML

κείμενο διακζςιμο και ςφνδεςμοι ΗΣΜ
L
,

ϊςτε να μπορεί το
robot

να ζχει πρόςβαςθ ςε αυτό.

2.

Κατάλογοι
: Οι καταχωριςεισ ςε καταλόγουσ
γίνονται
ςυνικωσ από ανκρϊπουσ. Οι
κατάλογοι δεν λειτουργοφν όπωσ τα
robot
. Δεν
κα ψάξουν να βρουν το
ν

ιςτότοπο
,

αλλά πρζπει κάποιοσ να το
ν

καταχωριςει.

3.

Πλθρωμζσ Διαφθμίςεισ
: Οι πλθρωμζνεσ διαφθμίςεισ είναι θ μζκοδοσ ςτθν οποία
υπάρχει ο
μεγαλφτερο
σ

ζλεγχο
σ

όςον αφορά τθ χριςθ λζξεων κλειδιϊν,
κακοριςμοφ γεωγραφικοφ
τόπου κα, ϊςτε
να
γίνει όςο το δυνατόν πιο
ςτοχευμζν
θ
διαφιμιςθ.

4.

Site

Feeds
: Αποτελεί μια εναλλακτικι λφςθ για τισ μθχανζσ αναηιτθςθσ
,

ϊςτε να
μαηζψουν πλθροφορίεσ από το
ν ιςτότοπο

χωρίσ να χρειαςτεί να «ςτείλουν» τα
robot
.
T
α
feeds

λειτουργοφν ιδιαίτερα καλά για
ιςτότοπου
σ

που ανανεϊνονται και

33

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

τροποποιοφνται πολφ ςυχνά όπωσ
blog
s
,
ιςτότοπουσ

ενθμζρωςθσ και
ιςτότοπουσ

online

πωλιςεων.

5.

Άλλεσ πθγζσ:
Βίντεο, Εικόνεσ, κλπ

6.

Μζτα
-
Μθχανζσ αναηιτθςθσ:
Είναι μθχανζσ αναηιτθςθσ οι οποίεσ δεν ζχουν
δικι
τουσ βάςθ δεδομζνων
,

αλλά ςυνκζτουν τα αποτελζςματά τουσ από τα
αποτελζςματα που δζχονται
,

ςτζλνοντασ τον όρο αναηιτθςθσ ςε πολλζσ άλλεσ
μθχανζσ
.

Οι αλγόρικμοι των μθχανϊν αλλάηουν ςυχνά
.
Αποτελεί ςφνθκεσ φαινόμενο οι
παράγοντεσ οι οποίοι είναι ςθμαντικοί για τισ μθχανζσ αναη
ιτθςθσ να είναι
ςθμαντικοί
και
για
τουσ
ιςτότοπουσ και τουσ χριςτεσ
.

Σα κείμενα
και οι λζξεισ κλειδιά
είναι εξαιρετικά ςθμαντικά για τισ μθχανζσ αναηιτθςθσ
.
Η
ςωςτι επιλογι των λζξεων κλειδιϊν
και οι κζςθ τουσ παίηουν ςθμαντικό ρόλο. Οι λεξεισ
κλειδιά
μπορ
οφν να τοποκετθκοφν
:


1.

΢τα κείμενα του

ιςτότο
που

2.

΢τον τίτλο
HTML

τθσ κάκε ςελίδασ

3.

΢τα κείμενα άλλων ςελίδων που αποτελοφν ςφνδεςμο για ζνα
ν

ιςτότοπο

(
anchor

texts
)

Ολιςτικι Προςζγγιςθ
.
Η υψθλι κατάταξθ

(
ranking
) ςτισ μθχανζσ αναηιτθςθσ αποτελεί
ςθμαντικό
ςτόχο
,

αλλά είναι μία μόνο πλευρά τθσ καμπάνιασ
SEO
. Σα παρακάτω είναι
εξίςου ςθμαντικά
:

1.

Η ςφνδεςθ άλλων
ιςτότοπων

προσ το
ν

ιςτότοπο

2.

H

καταχϊρθςθ ςε πιο μικροφσ
,

αλλά πιο ςτοχευμζνουσ και εξειδικευμζνουσ
καταλόγουσ

3.

Καταχωρίςεισ επί πλθρωμι

4.

Ποιοτικό περιεχό
μενο

Οι μθχανζσ αναηιτθςθσ δεν ευνοοφν παραπλανθτικζσ τεχνικζσ
.
Σζτοιεσ τεχνικζσ είναι:

1.

Cloaking
: Δθμιουργία ψεφτικων ςελίδων όταν το
robot

επιςκζπτεται το
ν

ιςτότοπο

2.

Διπλό περιεχόμενο

3.

Τπερβολικι
χ
ριςθ λζξεων κλειδιϊν ςτα κείμενα του
ιςτότοπου

4.

Κείμενα ςτο

χρϊμα του φόντου του

2.4

΢υνολικοί Παράγοντεσ κατάταξθσ

2.4.1.1

Ζρευνα για τουσ παράγοντεσ κατάταξησ 2009

΢φμφωνα με ζρευνα που διεξιχκθ το 2009 ςε 72 ειδικοφσ ςτο
SEO
,
ζχουμε τα παρακάτω
αποτελζςματα ςχετικά με τουσ παράγοντεσ που επθρεάηουν τθ κατάταξθ ςτισ μθχανζσ

αναηιτθςθσ

[52]
:




34

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ

΢ε επίπεδο ςελίδασ (
ς
χετικοί με λζξεισ
-
κλειδιά)

π
αράγοντεσ


Γράφθμα
3

-
΢ε επίπεδο ςελίδασ (΢χετικοί με λζξεισ
-
κλειδιά)
π
αράγοντεσ

Αξίηει να ςθμειωκεί ότι θ
Google

ζχει επιβεβαιϊςει μζςω του
Matt

Cutts
,
γνωςτοφ
μθχανικοφ λογιςμικοφ τθσ
Google
, πωσ δεν χρθςιμοποιεί το
Meta

Keywords

tag

ςτθν
κατάταξι τθσ (
http://googlewebmastercentral.blogspot.com/2
009/09/google
-
does
-
not
-
use
-
keywords
-
meta
-
tag.html
).




0%
20%
40%
60%
80%
Οπουδιποτε ςτο
tag
τίτλου

Ωσ πρϊτθ
-
εσ λζξθ
-
εισ του
tag
Σίτλου

΢το όνομα του
Root Domain(
π.χ.
Keyword.com)

Οπουδιποτε ςτο
tag
Η1
επικεφαλίδασ

Εςωτερικοφ ςυνδζςμου
anchor text
ςτθ ςελίδα

Εξωτερικοφ ςυνδζςμου
anchor text
ςτθ ςελίδα

΢το
Meta Description Tag

΢το
Meta Keywords Tag

Ποςοςτό ςθμαντικότθτασ χριςθ λζξθσ
-
κλειδί

Ποςοςτό ςθμαντικότθτασ χριςθ
λζξθσ
-
κλειδί


35

Θεμιςτοκλισ Μαυρίδθσ
-

Διπλωματικι Εργαςία

ΣΗΜΜΤ ΑΠΘ
-

Θεςςαλονίκθ 2011

΢ε

επίπεδο

ςελίδασ

(μθ ςχετικοί με λζξεισ
-
κλειδι
ά) π
αράγοντεσ


Γράφθμα
4
-
΢ε επίπεδο ςελίδασ (μθ ςχετικοί με λζξεισ
-
κλειδιά) παράγοντεσ

΢ε επίπεδο ςελίδασ δθμοτικότθτασ
ςυνδζςμων παράγοντεσ


Γράφθμα
5
-
΢ε επίπεδο ςελίδασ δθμοτικότθτασ ςυνδζςμων παράγοντεσ

0%
20%
40%
60%
80%
Ουςιαςτικό και μοναδικό
περιεχόμενο ςτθ ςελίδα

Πρόςφατθ δθμιουργία
ςελίδασ (
freshness)

Χριςθ ςυνδζςμων ςτθ ςελίδα
προσ άλλα
URL
ςτο ίδιο
Domain

΢υχνότθτα αλλαγϊν
περιεχομζνου ςελίδασ

Κείμενο ςτο
Tag Meta
Description

Ποςοςτό ςθμαντικότθτασ

Ποςοςτό ςθμαντικότθτασ

60%
65%
70%
75%
Anchor
κείμενο με ζμφαςθ
ςε
keyword
από
εξωτερικοφσ ςυνδζςμουσ

ποςότθτα/ποιότθτα των
εξωτερικϊν ςυνδζςμων

Ποικιλία των πθγϊν
ςυνδζςμων (ςφνδεςμοι από
πολλά μοναδικά
root
domains)

TrustRank
ςελίδασ (αν θ
ςελίδα ζχει "κερδίςει"
ςυνδζςμουσ από αξιόπιςτεσ
πθγζσ)

Ποςοςτό ςθμαντικότθτασ

Ποςοςτό ςθμαντικότθτασ


36

Ανάπτυξθ Μθχανιςμοφ Βελτιςτοποίθςθσ τθσ Θζςθσ Δικτυακϊν Σόπων ςε Μθχανζσ Αναηιτθςθσ

΢ε επίπεδο ιςτότοπου
(ςχετικοί με ςυνδζςμουσ) παράγοντεσ


Γράφθμα
6
-
΢ε επίπεδο ιςτότοπου (ςχετικοί με ςυνδζςμουσ) πα
ράγοντεσ


΢ε επίπεδο ιςτότοπου (μθ
-
ςχετικοί με ςυνδζςμουσ) παράγοντεσ


Γράφθμα
7
-
΢ε επίπεδο ιςτότοπου

(μθ
-
ςχετικοί με ςυνδζςμουσ) παράγοντεσ

63%
64%
64%
65%
65%
66%
66%
67%
Αξιοπιςτία του
Domain

Παγκόςμια δθμοτικότθτα