Spindlande Ericsson konkurrerande konkurrenter: Att indirekt indikera nätets "riktigare" kunskap och kultur istället för att upplevas död

2014-05-05

Jag råkade på en värre problem-sajt än ex. med Uppsala Universitet (magnituder värre) diskuterat i Några bias från en enkel web spindel. Problemet för den "nya" problem-entiten visade på en intressant domän av värde jag tidigare inte reflekterat exakt som reflekterat här.


Problem-sajt var www.ericsson.com. Det förvånar troligen få som betraktat dem över åren i domän av sökmotorer. Längre tillbaka när de fortfarande tillverkande konsumentprodukter var det både mycket mer anmärkningsvärt som problem resp. som jag upplever jämförande vad jag såg nu med som jag minns det värre. Värre i mening större rena tekniska problem hur man skapade navigering, länkar m.m. för olika typer av riktade sajter för att marknadsföra produkter. För Xperia gjorde SonyERicsson ett tämligen seriöst marknadsföringsförsök och i domän av koncept i marknadsföring som jag upplevde det mycket välgjort såväl som hyggligt i alla fall hur man realiserade det samma bl.a. i grafik på nätet. Men i det rent tekniska kring interna länkar, att fora ut innehåll praktiskt m.m. fungerade det inte alls bra och sajterna märktes knappt alls på nätet.


I exemplet här gjorde jag en riktat spindling av ett fåtal tekniska sajter. Ingen länk besökt besöks mer en engång men körningen startas utan historik bakåt. Det inleddes första gången med följande (söka viss balans mellan några stora samt för att få av annat intresse en kontrast mot försäljning inriktat dominerande större företag i färre stora affärer resp. närmare mot konsument eller kontinuerliga men vid återkommande diskreta tidpunkter avgjorda affärer jfr licenser for programvara mot företag):


$ldb{"http://librariancentral.blogspot.se/"}++;

$ldb{"http://googlescholar.blogspot.se/"}++;

$ldb{"http://marissamayr.tumblr.com/"}++;

$ldb{"http://www.ericsson.com/"}++;

$ldb{"http://www.idg.co.uk/"}++;

$ldb{"http://conversations.nokia.com/category/news/"}++;

$ldb{"http://blog.aol.com/"}++;

$ldb{"http://blogs.technet.com/"}++;

$ldb{"https://blogs.siemens.com/"}++;


För att hitta sajterna prövade jag att söka Google på företag CEO blog. Det fungerande inte perfekt för någon (Microsoft gav tror jag det i bästa resultatet) och tycker jag sämst för Ericsson eftersom negativt bias ligger i titlarna:



Givetvis genom att uttrycka idag normal-standard av typiska kanaler som att man finns sociala media, har en blogg o.s.v. fungerar vad som gick fel ovan väldigt lätt bra med åtminstone Google.


Det fungerade sämre för Siemens och Ericsson än jag såg som praktiskt bra. Deras uttryck expansion att spindla kom mycket nära från start till nära nog ingenting jämfört med övriga. Därav att jag hjälpte upp resp. något:



$ldb{"https://blogs.siemens.com/tagcloud"}++;
$ldb{"http://www.ericsson.com/yourbusiness/telecom_operators"}++;
$ldb{"http://www.ericsson.com/news"}++;
$ldb{"http://www.ericsson.com/news?query=ericsson"}++;
$ldb{"http://www.ericsson.com/thecompany/press/releases"}++;


D.v.s. för expansion länkar som över epoker tidigt växer exponentiellt startar de direkt som om de vore flera.


Oavsett insatsen föll de ganska snart bort. Tröskelvärde för när en domän (hanterande subdomäner som egna domäner) ej fortsatt besöktes var satt till 111. Vad jag här menar med föll bort är emellertid varken just att dom initiala domänerna är borta eller att andra subdomäner från samma entitet ej heller är med utan att:


  • Där spindeln står just nu och sedan minst sagt länge.
  • Gäller att alla övriga aktörer (inkl. Nokia om än inte riktigt på nivå med Microsoft: Men ej heller förväntat) uttryckt och visat upp vad som bibehållits och expanderat till en både ämnesmässig och implicit i domäm av markandsföring relevant internet-kultur i de sajter som spindlats ut.

Betraktar vi Google's bloggar här såväl som generellt är en funktion de tycks uppfylla att vara kontakt yta mot för dem viktiga subkulturer (ex. entiteter intresserade av att köpa annonsering, bibliotekarier m.fl. potentiellt intresserade av Google Book Search, trevliga värderings-relaterade projekt som ser bra ut såväl som för ett större företag kan vara del av att medverka till ett samhälle också fortsatt funktionellt att verka i - ex. tänkbart demokratifrågor - eller nog så viktigt för ett företag som rekryterat snabbt diverse student-relateradee projekt såväl som kontaktytor rent allmänt mot universitet). Från Google's biblioteksblogg (ej uppdaterad sedan om jag minns rätt 2008 eller 2009 och totalt med få inlägg) gavs ändå märkbart länge ett uttryck för subkulturen runt bibliotek, indexering böcker, bibliotekarier o.s.v. (ett av internets mer intressanta om än inte alltid mycket märkta verksamhets- såväl som tekniska domäner).


Utgångspunkt för Microsoft såväl som AOL (svårare för mig att bedöma för Google därför att jag tillåter ej spindling mot sajter med Google i namnet utanför blogspot eftersom jag använder diverse Google-tjänster själv och inte vill riskera någon låsning eller liknande p.g.a. relaterad IP-adress) expanderade båda snabbt och varaktigt upp i en mängd egna sajter (inkl. subdomäner) såväl som en försvarlig mängd mer läsar-konsumtions-nära publikationer (av typen kortare ytligare nyheter relaterat ex. nya versioner av produkter eller mer nyhets-potenta tekniska nyheter resp. nyhets-domäner där läger av anhängare ställs mot varandra).


För Yahoo kom en hel del men för flera sajter är det inte helt enkelt utan att titta mycket exaktare vägen de kom att uttryckas via. Särskilt Flickr där det framgår enkelt att en hel del är från Meyers blogg men andra kommer inte otroligt från annat. Utanför det av någon anledning bl.a. något sport-relaterat jag ej besökt (och som jag trodde filtrerades bort från spindling av orsaker besläktade dom för Google).


IDG trots trögstartad kom dock att växa bra över tiden.


Men för Ericsson är endast ett Twitter-konto (eller om det ev. var Tumblebr) vad som märktes en tid. Ett arkiv visade sig också några gånger men verkade aldrig leverera några länkar för fortsatt spindling (det kan vara relaterat hur jag detekterar och extraherar länkar som är mycket närmare HTML 1.0 än att tänka bredd i vad vi försöker ta ut).


Föreställning att det ej spelar roll tror jag är felaktigt. Jag kan tänka mig att en del äldre koncept hade kunnat kvarstå framgångsrika om områden som dessa fungerar bättre. Vidare även om man riktar in sig på större affärskunder i långsamma affärer kännetecknas ju dessa just av att vara mycket kompetens-drivna rörande allt relaterat att passa in tekniska koncept i dom egna lösningarna. Att etablera synlighet för hela området för tekniska standarder, inriktningar m.m. närmare det egna tänket bör tror jag sett över en längre tid löna sig oerhört. P.s.s. för färskare konkurrerande företag kan samma synlighet löna sig ordentligt mycket mer därför att för dem finns mindre av upparbetad befintlig kunskap om de egna lösningar hos potentiella kunder. Däremed gäller eftersom mängden uppmärksamhet en befintlig kund eller prospektiv kund är begränsad att det är viktigt oavsett välkänd aktör eller ny aktör att etablera synlighet också för att inte lämna det itll andra att ockupera. Dessutom är det i kostnad så billigt att det bara är löjligt att inte göra det ordentligt.


NNedan hur det hela såg ut just nu. Finns intresse (och filen inte är abnormt stor) kan jag lägga upp loggen över sidor spindlade och vad de resp. länkar (för identifierade länkar). Jag vet här egentligen inte riktigt hur länge denna och tidigare diskuterade går innan de själv-avslutar sig via minnes-brist. Ingen av dem även om de sparar ner till disk utnyttjar disk för sina tillstånd utan behåller allt i minne och kommer jag ihåg rätt görs igenom garabage-hantering relaterat besökta sajter. Jag är om något här för första gången på väldigt länge imponerad av Microsoft 7. Rimligen finns viss gömd hantering av vad i minne och på disk utan att pgorammen har behövt bry sig (åtminstone för den äldre tråden tror jag givet cirka 500 - 900 000 länkar besökta, att besöka samma epok, resp. samlade för nästa epok).


Länkar med information som ej följs av en rad skapad med = besöks ej. D.v.s. oavsett antal indikerade besök stannar dessa på tröskelvärdet och här 111. Information som ges tillsammans med resp. utskriven länk är den samma som förklarad i Några bias från en enkel web spindel.

Jag känner verkligen att värdet bäst här sammafattas med det mer abstrakta i att långsiktigt stödja rent kultur runt om sig i internet-världen. Såväl tekniskt som i det kanske mer "lätt propaganda relaterade". Jag tog emellertid ut några stereotypiska händelse-kategorier från ett system (Pack Nature) av sådana jag tog fram manuellt beskrivande mer abstrakta (och mindre manifesta) uttryck samtidigt som jag utvecklade natural language processing för att ta ut händelser från nyheter (med fokus på citat och talstreck relaterat den som uttalar sig) jag tyckte passande in på några aspekter av det kan handla om:


__RELY_ON count depend rely

__ADMIRE admire adore appreciate cherish enjoy esteem exalt
fancy favor idolize like love prize treasure trust worship

__ACCOMPANY accompany conduct escort guide lead shepherd

__APPOINT appoint commission crown denote designate
elect mark nominate ordain promote appoint crown designate elect mark nominate
ordain

__MOTIVATE encourage empower tempt bribe tempt motivate
encourage empower flatter

__NOTIFY instruct notify remind alert brief

__EDUCATE educate instruct lecture train tutor teach

__INVITE invite summon

__WELCOME welcome greet

Närmare det tekniskt praktiska och representerande en försvarlig andel av Microsofts sajter:


__SUPPORT assist help support back fund backing endorse aid
help out endorse donate

__FRIENDLY_ALERT alert of danger caution warn

Och vad Google ger ett av för dem många och återkommande exempel på i Google Code-in Grand Prize Winners visit Google:


__REWARD_LOYAL reward commend honor badge

__COMPLIMENT compliment

__ORGANISE co-ordinate regularise formalise phase sequence
plan organise sort order rank prioritise classify
group match select compare resemble detect

Medan det givetivs för något så brett och djupt etablerande för allt när det gäller information viktigt är sämre att göra:


__SURRENDER surrender capitulate succumbe white flag yield surrender
pay tribute bow to

Om man vill reducera risk för konkurrenternas imperativa försök ute hos kunderna:


__IMPERATIVE_ATTEMPT pressure urge summon order charge command compel encourage instruct
tempt urge ask request invite order command motivate order press remind request ask allure
call on prompt dictate challenge bribe empower encourage admonish beg cajole lobby press
ask beg dare help trouble bother

__LEARNING_BY_SHAMING

Också för att hjälpa motivera Ericsson med learning by shaming en QA jag satt bredvid 1999 på Ericsson (Nackstrand i IP@Service) kallade en metodik han berätta för mig om när vi brukade äta lunch tar jag med skärmdump. Skärmdumpen är från när jag initialt försökte hitta några bra undersidor för att hjälpa upp dom med och öppnade upp några av länkarna som fanns längst ner på startsidan.



Dessutom var exemplet lite intressant genom att jag inte tror (jag tittade emellertid inte på html-koden) primärt ett tekniskt problem med hur man "kodat" länken. Problemet är ju dessutom primärt för riktiga användare resp. reducerande mängden bättre sidor att ta upp för vidare besökt konkurrerande andra sajter på given budget tid och bandbredd.


Och __LEARNING_BY_SHAMING sorterar hos mig in i ridicule (jag försökt mig på några gågner av och till på bloggen i form av skämtteckningar):


__RIDICULE reduce pack status have lesser men, women and children laugh at the man mockery contempt contempt inducing sneers taunts taunts without accepting reality of payback risk: reduction of pack value for target

Även om området här är lite för tråkigt och dessutom för snällt skrivet vilket ibland tycker jag är lättare för stora företag som Google, Ericsson, Microsoft m.m. Det omvända mot:


__POLITE__WITH_THE_LESSER polite respect of a lesser but skillfull enemy

Vilket man ofta nog ska ta som förvarningssignal (jämför det Brittiska imperiet vs Mahatma Gandhi). De mindre har en förmåga att växa sig stora medan man artigt erkänner vissa värden i det lilla.


Spindlingen startad på The Guardian - Några bias från en enkel web spindel - arbetar på utan att överhuvudtaget störa datorn i övrigt.