den 3 december 2008

Google köpte 20 milioner gamla tidningssidor från Paperofrecord.com

Tidningssidorna är digitaliserade och Google har köpt dem från Paperofrecord.com. Digitaliserad kan ju betyda väldigt många olika saker t.ex. att det är bilder av tidningssidorna. Faktiskt är det just detta som det handlar om så vitt jag tolkar exemplet som Paperofrecord.com hänvisar till: The Toronto Star. Paperofrecord.com skriver dessutom:

"[...]PaperofRecord.com® is a Global pioneer of searchable newspaper image documents presented in their original published form."

Digitaliseringen innebär inte som med bl.a. Project Runeberg att de presenteras både som digitalbild och html-sida. Istället kan det se ut t.ex. som nedan där bilden av tidninssidan presenteras som PDF-fil:

Att den här PDF innebär emellertid inte att man kan söka i löptexten utan det är just en bild av tidningssidan som fotograferats.

Dessutom finns en sökfunktion
Till det har Paperofrecord.com lagt till något som gör det "sökbart". Exakt vad det innebär och hur det fungerar har jag inte lyckats ta reda på men min spekulation efter att ha prövat lite är att de nog använder bildanalys för att ta in rubriker ur respektive tidning och att nyckelord där används som taggar där dessa taggar blir motorn i sökalgoritmen.

Enligt pressmeddelandet tänker Google försöka få in arkivet i Google News:

"'Acquiring the rights to the PaperofRecord.com content enabled us to include a robust set of Canadian newspaper content very quickly in our News Archives initiative -- such as the Quebec Chronicle-Telegraph, the oldest newspaper in North America -- as well as a number of interesting US newspapers.', according to Punit Soni, Product Manager, Google News Archive. "

Är det här ett bra köp?
1. Det handlar dels om hur svårt det är att digitalisera historiska tidningar och vad det kostar om man inte köpt det. Spontant känner jag att det bör vara lätt och billigt åtminstone i varje fall där copyright inte längre gäller. Men samtidigt tar allt tid och oförutsedda problem uppstår alltid. Kan man slippa att göra det själv är det nog välkommet för de flesta.

2. Dessutom är det också viktigt om folk egentligen vill läsa tidningar på det här sättet. Generellt tror jag inte det utan folk är vana vid html och att publicera i något annat format på nätet är dumt. Bilder som sedan i sin tur stoppas in i PDF-filer är långt ifrån det bästa alternativet. Samtidigt är det här naturligtvis en marginalgrupp av potentiella läsare som söker väldigt speciell information. Att få denna information på det här sätt är mycket lättare än alla andra sätt som redan är möjliga. Trots ett bökigt format blir det på det här sättet lättare.

3. Fråga tre handlar hur Google kan utveckla tjänsten vidare. Sökning kan de bra och access till ett abnormt stort arkiv med gamla tidningssidor handlar om sökning så vida man inte redan har ganska exakt information om ort och datum. Samtidigt är sökning av stora datamängder inte ett lätt område. Att köpa in något som man kan lägga något bra till man själv är nog inte så dumt.

4. Slutligen är det intressant att fråga sig hur svårt det är att få över bilderna till text. Det är naturligtvis viktigt redan i tre för att möjliggöra sökning av hela textarkivet. Jag tror inte det behöver vara så himla svårt. Det är mönsterigenkänning som det handlar om och det är ett forskningsområde där man nått långt. Programvaror finns ju faktiskt också tillgängliga redan i flera öppna projekt som det svenska Project Runeberg. Det handlar nog främst nu om att programvarorna ska gå några generationer snarare än att mönsterigenkänning som forskningsområde behöver nå längre innan man kan få över sådana här sidor med färre manuella ingrepp än vad som krävs i exempelvis Project Runeberg.

Så det här kan nog vara ett bra köp för Google. Sedan gäller det också att de inte glömmer bort sina gamla projekt: Blogger, Gmail, Search m.m.

Läs mer i pressmeddelandet som bl.a. finns hos Market Watch (The Wall Street Journal): "PaperofRecord.com Completes Sale of Digital Newspaper Archives to Google"

den 22 november 2008

Framhävda länkar i kataloger

Jaha nu fick jag ett e-post om att framhävd länk i www.kvalitetskatalog.se ändrats därför att jag inte längre länkade tillbaka. Men det är klart att jag inte gör det eftersom situationen efter att jag registrerat mig blev annorlund:

  • Jim Westergren började tydliggöra att han säljer länkar vilket jag när jag länkade tillbaka inte kände till. Detta bl.a. i forumpostningar på SEO-forum och i reportage i tidningar. Jag kan inte länka till sådant eftersom man riskerar att länka till sajter som går ur index.
  • Han får dessutom mängder av webbsajter utkastade av Google och jag vill inte riskera att länka dåligt grannskap.
  • Katalogen upplevde jag förövrigt då höll allt sämre kvalitet på länkarna. Jag vill inte länka till en sajt som i sin tur stödjer sajter jag själv absolut aldrig skulle länka till.

Men syn är att man visst ska länka till kataloger om de håller god kvalitet. Sedan ska man givetvis göra det på ett sätt som besökaren har nytta av det. För mig är det t.ex. logiskt att i så fall göra det här på www.seotaktik.com eftersom besökarna här typiskt letar efter sådana resurser. På webbsajter som inte rör sig i detta område är värdet sällan tydligt. Det ska i så fall vara länkar till mycket välskötta specialistkataloger eller djuplänkar till mycket bra kategorier i bredare kataloger.

Jag kan säga att jag regelbundet går igenom alla länkar både här och på andra sajter och städar bort allt som inte längre ser ut att hålla måttet. Katalogerna jag länkar upplever jag håller hög kvalitet och signifikant mer än vad folk i allmänhet väljer till att länka i det segmentet. Sådan kvalitetsuppföljning kan jag verkligen rekommendera som en bra onpage SEO-metod. Jag kan där ge som exempel ett par stora bloggar jag försummat och då tog mig en dag och gick igenom alla länkar. Särskilt den ena visade sig ha länkar till sidor som inte höll måttet. Det handlade bl.a. om nya sajter som verkar lovande men sedan när de fått lite kataloglistningar m.m. slutat att publicera eller lagt in en massa tveksamma länkar. Efter utrensningarna stärktes båda bloggarna minst sagt signifikant - riktigt tydligt.

Tittar vi på www.kvalitetskatalog.se har jag inte besökt den på ett tag. Men jag hör underligheter. En sajt som jag vet är en den mest seriösa aktören i sitt segment och en av få där som utvecklar riktigt innehåll med värde togs bort för kanske en veckan sedan (?) för att den påstogs inte hålla måttet. Det var inte min sajt varav alla kvarstår (tar han bort dom vet vi att det är för han kritiseras här eftersom de kvalitetsmässigt ligger i topp 2% på vad den katalogen har) Jag tog och surfade runt övrigt topp 20 i det segmentet och förutom ett par sidor associerade till staten samt denna sida var allt i övrigt sådant jag själv inte skulle länka till. Sådant får mig att fundera.

Microsoft rekommenderar SEO genom köp av länkar & länkbyten

Här har vi en kul liten guide skriven av Skip Chilcott som är Sr. Product Manager - Office Live Small Business hos Microsoft i Redmond. Det hela handlar om SEO med länkbyten och länkköp vilket han ser ut att rekommendera.

I princip rekommenderar han flera metoder för länkbyten för att få mer trafik från sökmotorer. Jag menar att man kan göra länkbyten på ett sätt som är seriöst och accepterat. Det gäller i så fall ett länkbyte där man tillför värde för läsaren och tar hänsyn till kvalitet genom att göra en redaktionell bedömning.

Oseriösa metoder för länkbyten Microsoft rekommenderar
De metoder Microsoft rekommenderar är däremot nästan alla helt oseriösa. Vidare understryker i de övrigt heller inte betydelse att tillföra värde för läsaren och göra en redaktionell bedömning. Helt oseriöst är givetvis att gå med i program där automatiska länkbyten sker genom att du saknar kontroll över vilka länkar som dyker upp. Flera av metoderna Microsoft rekommenderar här handlar just om detta. Exempel:

"Join an automated link-exchange program. You can pay to have your site automatically included on all the Web sites of program members. A filtering option is typically available to exclude your site from link exchanges you don’t want. Check out LinksMaster.com for an example of this type of program."

För att inte tala om det här:

"Use link-management software. To avoid the drudgery of reviewing sites to find potential link partners, you can purchase software that does that — and more. iBusinessPromoter is one example, and has a free trial version you can download."

Microsoft rekommenderar köp av länkar för SEO
Chilcott går han rent av ett steg längre och rekommenderar läsaren att betala företag för att ordna länkar. Någon information om vad han mer exakt menar med det ges inte och i princip lär nog många läsare som saknar kunskap ge sig ut och köpa länkpaket efter att läst det där och utan att inse riskerna som finns med det:

"Pay someone else to create your links. A number of companies specialize in finding and managing linking services, dramatically minimizing your involvement. LinkStrategy.com is one such service."

Varför skriver Microsoft så här?
Det hela känns anmärkningsvärt. Jag kan se två möjliga orsaker till att det här har publicerats:

  • Författaren kan egentligen ingenting om området men valde att skriva något trots det.
  • Microsoft Live! räknar med att de är mindre känsliga för sådana här störningar än Google och ser därmed ett värde att uppmuntra det.

Läs mer
Du kan läsa artikeln i sin helhet här: How to get link exchanges to help boost your traffic

Det kan ju också vara klokt att mycket noga läsa riktlinjerna för Live! där man bl.a. skriver:

"Använd inte metoder som på ett artificiellt sätt ökar antalet länkar till din sida, t.ex. med så kallade link farms (länksamlingar)."
Från: Riktlinjer för indexering

Samtliga citat är från 2008-11-22.

den 20 november 2008

MoYuMe - Jaiku med Bilder

Här har vi något nytt som kanske är intressant. Det här är en webbsajt där det är tänkt att man dokumenterar sitt liv med bilder. Konceptet liknar med andra ord Jaiku fast du fotograferar istället. Du tar en bild med din applikation och MMS:ar den till tjänsten.

Jag har inte testat det men tyckte det var lite intressant att fundera runt avseende paketering. iPhone och iPod är ett av många exempel på att koncept, paketering, design och trend är viktigt. På det här sättet används redan Flickr med flera fototjänster men det innebär inte att utrymme inte finns för det här. Därför att när man tänker Flickr tänker man fotodelning. Här kan en annan grupp av användare attraheras.

Sajten har vi här: www.moyume.com