PDA

Zobacz pełną wersję : Google ...



Vito Andolini
07-12-05, 13:10
Google jest unikalnym rozwiazaniem łaczącym zaawansowaną technologię z wyjątkowym softwarem. Aby osiągnąć wysoką wydajność systemu stworzony został superkomputer, który składa się z setek tanich komputerów połączonych w sieć.

Sercem programu jest unikalne rozwiazanie PageRank(TM) określające ranking znalezionych stron. Najwyżej cenione są te dokumenty, do których jest najwięcej odnośników ze stron cenionych przez Googla. Wyjaśnimy to na przykładzie. Odnośnik ze strony A do strony B Google traktuje jako głosowanie strony A na stronę B. Dalej analizuje stronę A, czy jest wysoko w rankingu i w zależności od miejsca nadaje odpowiedni priorytet stronie B.

Algorytm wyszukiwania jest bardziej skomplikowany, gdyż łączy technikę PageRank z techniką wyszukiwania tekstów łącząc trafność znalezionych stron z ich wagą. Google analizuje całą zawartość strony w poszukiwaniu słów kluczowych, aby znaleźć odpowiedni dokument.

Od niedawna ważną cechą ustalania rankingu jest obecność strony w katalogu stron Open Directory - http://dmoz.org/




Jak w Google zobaczyć inne strony, które piszą o Twojej?
Możesz łatwo sprawdzić, jak wiele stron pisze o Tobie. Wystarczy wymusić pokazanie stron zawierających Twój adres i pominięcie stron z Twoim adresem w linku

+"kataloog.info" -site:kataloog.info


Jak dodać stronę do google (indeksowanie)?

Uwaga: wystarczy zgłosić pierwszą stronę serwisu. Robot o nazwie Googlebot odwiedzi wszystkie podstrony i linki na znalezionych stronach.

http://www.google.com/addurl/?continue=/addurl


# Indeksowane dokumenty:
- pdf
- xls
- ppt
- doc
- rtf
- txt
- ps, wk1...wk5, wki, wks, wku, lwp, mw, wks, wps, wdb, wri
Google konwertuje wyżej wymienione dokumenty do formatu HTML. Nie trzeba mieć specjalnych programów do ich otwarcia.

# Jak google indeksuje strony?
Google wysyła swojego pająka - googlebota by szukał witryn internetowych i indeksował je - zbierał zawartość. Indeksując strony HTML googlebot zwraca uwagę głównie na elementy najbardziej widoczne dla użytkownika. Tagi meta oraz np. komentarze HTML mają małe znaczenie gdyż nie są widoczne dla użytkownika. Robot zwraca szczególną uwagę na frazy występujące między znacznikami H1, H2 itp. pogrubione lub napisane kursywą. Ważna jest też częstość wystąpienia danej frazy na stronie. Najważniejszym czynnikiem określającym pozycję strony w wynikach jest...

# PageRank
Nazwa pochodzi od L. Page'a i określa sławny algorytm Google, dzięki któremu wyszukiwarka ta stała się tak popularna. PageRank to wartość jaką posiada każda strona. Upraszczając jego wartość zależy od popularności danej strony w internecie, od liczby odnośników prowadzących do danej strony z innych serwisów. Im więcej tym lepiej. Każda strona odsyłająca do badanej strony przekazuje część swojego PR stronie badanej. Im popularniejsza strona linkuje do nas tym większy będzie nasz PR. W przypadku gdy obie strony wymieniają się linkami ich PR może wcale się nie zmienić jeżeli ich popularność jest zbliżona Google dość często ignoruje takie towarzystwa "wzajemnej adoracji" oraz strony z dużą ilością linków - tzw. farmy linków, strony które mają generować sztuczną popularność. Umieszczanie linku na takiej farmie może skończyć się nawet obniżeniem pozycji strony. Googlebot nie czyta linków ukrytych w np. animacjach FLASH. Skrypty JS zaczyna właśnie czytać!
- Wymieniaj się linkami z innymi stronami na zasadzie - oni link tekstowy do ciebie a ty do nich button flashowy
- Tworząc różnego rodzaju darmowe skrypty czy szablony zawierające stopkę do twojej strony pamiętaj by umieścić ją trochę wcześniej niż na samym końcu kodu.
- Zarejestruj się na forach o podobnej tematyce do twojej strony, daj w podpisie link do twojej strony! (pod warunkiem że forum jest indeksowalne i w linku nie ma "sid=") (jeżeli jest to phpBB poleć im moduł krótkich URLi Biblioteki
- PageRank przyznawany jest dla danego serwisu i jego wartość rozprowadzana jest na wszystkie jego strony. Stosuj strukturę hierarchiczną tak by główna strona miała jak największy PR (strona główna odsyła do spisu artykułów, spisy do głównej i do artykułów, artykuły odsyłają do spisów i strony głównej)
- PageRank w skali od 0 do 10 możesz zobaczyć za pomocą GoogleToolbar, nakładki na przeglądarkę IE. Do ściągnięcia ze strony Google.
- Google lubi strony, których linki są w katalogi Yahoo i DMOZ. Przekłada się to na większy PR

# Taniec Google (Google Dance)
Co około 4 tygodnie następuje przeliczenie wartości PR stron, dodanie nowych - aktualizacja bazy. Baza Google jest ogromna i aktualizacja nie jest natychmiastowa. Trwa kilka dni i w tym czasie wyniki wyszukiwania danej frazy wykonane w krótkich odstępach czasu mogą różnić się. To jest tzw. taniec google, "szybka" zmiana rezultatów wyszukiwania. W czasie google dance można zobaczyć mniejwięcej jak zmienią się wyniki wyszukiwania. Wystarczy w danej chwili dokonać wyszukiwania na stronach:
- www.google.com
- www2.google.com
- www3.google.com
www2 i www3 to adresy do "testowych" wyszukiwarek korzystających z różnych baz danych. Zawsze jeden z nich korzysta z najświerzszej (zaktualizowanej) bazy. Można sobie ułatwić i w google wpisać "googledance" wyskoczy trochę stron. Na większośći z nich znajdziemy pomocny skrypcik wykonujący wyszukiwanie na tych 3 stronach i pokazujący je w jedym oknie co jest dość pomocne...

# Tworzenie zapytań
- Google nie zwraca uwagi na wielkość liter użytych w zapytaniu
- Znak "+" np: "jan+sobieski" oznacza że w wynikach mają pojawić się strony zawierające oba słowa kluczowe
- Znak "-" działa odwrotnie, "sobieski-jan" znajdzie sobieskich, ale nie janów
- objęcie frazy w cudzysłów, np. "jan 3 sobieski" oznacza że mają się pojawić strony zawierające dokładnie taką frazę, wyraz po wyrazie.
- komenda "intitle" umożliwia wyszukanie frazy w tytułach stron, np: intitle:kapusta. Jeżeli szukamy frazy złożonej z kilku wyrazów możemy skorzystać z komendy allintitle.
- komenda inanchor: szuka frazy w linkach między a i /a. Komenda inurl: szuka wyników w nazwach linków zindeksowanych stron
- komenda site: spowoduje wyświetlenie stron zindeksowanych z danego serwisu (domeny) np. site:riklaunim.ekonto.net

# Google i webmasterzy
Google udostępnia wyniki swych wyszukiwań za darmo. Za pomocą skryptu napisanego w PHP czy CGI możemy mieć wyszukiwarkę Google na własnej stronie - wyniki prezentowane są u nas. Skrypty te działają w oparciu o bibliotekę SOAP lub nuSOAP. By skrypt działał musimy podać mu Klucz Licencyjny Google, który uzyskamy za darmo po rejestracji na stronie google (googleAPI). Limit: 1000 zapytań dziennie. Problemy: Siada obsługa polskich liter, nie działa tak szybko jak samo Google. Odpowiedni skrypt można znaleźć np. na www.hotscripts.com w dziale skryptów PHP.






Zmiana domeny przy zachowaniu GPR

Często zdarza się tak, że odchodzimy od starego adresu strony za sprawą nowej, świeżo kupionej domeny. Może nasza strona miała już GPR (Google Pgae Rank) = 4 oraz całe mnóstwo indeksowanych linków przez Google do naszej strony. Czy musimy to wszystko stracić ? Odpowiedź jest prosta - nie.

Jak to zrobić i zachować GPR

Wydawać by się mogło, że jest to skomplikowana sprawa, ponieważ gdy zmieniamy adresem naszej strony na pierwszy rzut oka dla Google nie ma żadnej relacji pomiędzy stronami (w sensie ustalania GPR i innych atrybutów).
Jakby nie było GPR jest przypisany staremu adresu a żeby doprowadzić nową stronę do tak wysokiego GPR jak na przykład 5 trzeba włożyc sporo pracy.
Jak się okazuje jest sporo metod pozwalających nam poinformować Google, że stary adres jest nieaktualny a wpisy w Google, GPR, Link popularity oraz inne atrybuty należy przydzielić nowemu adresowi. Najpraktyczniejszą z nim jest tzw. Przekierowanie 301 lub 302


Różne metody rozwiązania tej kwestii


Metoda 1 - Przekierowanie w PHP
Metoda, która udostępnia nam jakże dobrze wszystkim nam znany język programowania typu klient-serwer - PHP. Tak prezentuje się prosty skrypt, który dokonuje przekierowania 301 na nową stronę.
Kod:
<?
Header( "HTTP/1.1 301 Moved Permanently" );
Header( "Location: http://nowy_url.pl" );
?>

Aby skrypt zadziałał poprawnie musimy pamiętaj, że nagłówek (Header) musi być zadeklarowany przed wszelkimi innymi elementami, które powodują wyświetlanie się treści na stronie.


Metoda 2 - przekierowanie w ASP
Język programowania ASP także daje nam możliwość wykonania przekierowania 301,301. Oto przykładowy kod dzięki, któremu takowe przekierowanie zostaje wykonane.
Kod:
<%@ Language=VBScript %>
<%
Response.Status="301 Moved Permanently"
Response.AddHeader "Location", " http://www.nowy_url.pl"
>



Metoda 3 - przekierowanie w ASP.NET
ASP także nie zostaje bez takiego przywileju, przekierowanie 301,302 jak widać dostępny jest w większości języków programowania wykonywanych po stronie serwera. Oto kod:
Kod:
<script runat="server">
private void Page_Load(object sender, System.EventArgs e)
{
Response.Status = "301 Moved Permanently";
Response.AddHeader("Location","http://www.nowy_url.pl");
}
</script>



Metoda 4 - przekierowanie z użyciem .htaccess
W plikach .htacces, które zamieszczamy w katalogach na naszym serwerze możemy wrzucić specjalna instrukcje, które także wykona odpowiednie przekierowanie tzw. Redirect permanent - czyli przekierowanie stałe. Oto kod:
Kod:
Redirect permanent / http://www.nowy_url.pl



Oto najbardziej rozpowszechnione w internecie metody wykonywania przekierowania 302 za pomocą języków programowania oraz .htaccess. Myślę, że te które wymieniałem z zupełnością wystarczą aby korzystać z nowej domeny z atrybutami, które posiadała nasza strona na poprzednim adresie.

polecam tez strone http://www.strajk.pl/

:) :) :)