Microsoft: Att våga ge en hjälpande snäll Bamse-kram

2015-05-19

Avslutande fortsättning på mitt möte med Microsoft: Microsoft: Att våga vara moraliskt större och räcka ut en hjälpande hand.


Ofta kan man komma längre med att vänligt hjälpa till att lösa problemen. Och för motivation tydliggöra incitamenten för en säkert engagerad go-getter jos Microsoft. Det är hur som helst oavsett effekt säkert trevligt på dennes sida att man avslutar vänligt ej bara fördöma och se ner på en annorlunda kultur med utmaningar ej riktigt samma som alla vi andra också har.


Metodiken rätt här är att:


  • Bekräfta var vi står. Repeterande bullet points.
  • Uttryckaaccepterande och att det är ok ej kritiskt att Ricky ej klarade att lösa problemet. Markerande förståelse av att det är Microsoft mer än han.
  • Ge några tekniska förslag på lösningar.
  • Och jag väljer exempel som Microsoft kan relatera till: Så att det känns rätt för dom också. Lite som att du kanske hellre väljer en ny produkttyp när andra du känner köpt den.
  • Uttrycka vi. Ett gemensamt projekt där jag förstår hur det är ibland hindrande. Även om projektet slutar med mitt e-post.
  • Men också pekande på värdet för Microsoft och hur det kan översätte till karriär för Ricky. Om så vinner alla: Microsoft klarar att dela datat utan att gå sönder, Jag får data, och Ricky blir boss en bit upp.
  • Och så förklarar jag hur han går över-kulturen för att märkas som problemlösare som vågar ta ansvar: Stora företag formaliserar metoder. Microsoft införde en del här för några år sedan. Dessa två faktorer är två när särskilt mätbara värden finns som är vedertaget funktionella.
  • Och jag är konkret: Ta denna information till ISS-folket. Så de förstår att dela upp filerna istället för att kanske igen försöka lägga ut flera tera byte jätte fil på webb-servern.

Trevligt värde för alla. Vi får hoppas på att han vågar ta steget och det blir trippel vinst. Det skulle så glädja.


sHans Husman
23:06 (3 minuter sedan)

till Ricky
I understand that you did found information about API here.

But other question would be the time to take down the statistics so I can combine it with other corpus I have for comparsion with them.

Would it take mounth making millions, millions requests? One for each requests?

And how did you think sharing data without sharing it?

I could see one motivation for this corpus to start with was quality tests of Bing. It is very good today but as obvious at this time bad. Could it perhaps be if not unsound data by itself be related quality problems during this time making Microsoft less motivated to share the data in a way making it usable in a real sense for larger analysis.

And I would for sure not mind at all if you if so just explained if you arent quite the right person to complain with here. Perhaps mostly finding out answers for how it works but not having anything to do with the sharing specific or general.

I probably wouldnt care to waste time with it with someone else either but either way so or not it is more time effecient for me.

I also think perhaps not correct here but associated impressing with Microsoft web stuff before that you are able to handle a lot of transactions. But it is from time to time surprising unstable to keep stable "sessions" (borrowing a bit of ASP culture I probably wrong like to think I remember from 2000 doing a bit of Microsoft program-culture).

One solution would be to like a few universities sharing big through harddisk you pay for. I wouldn't for this to be sure.

[HERE A GIVE A TECHNICAL TIPS THAT MIGHT FIX THE MICROSOFT ISSUE.]
Or like Google sharing it's book n-gram data for sure with quite large files but not abnormal so. Instead making a lot of files with lesser sizes (if I remember right 500 MB to a bit below 1.7 G each and from say 300 to a few 1000 depending on how much over versions or even more languages you want). So even if it would just go non-functional sharing like one big many T files you can split it up: Perhaps even sorted making import into databases a lot faster.

[UTTRYCKER FÖRSTÅELSE OCH VI: LÄMNANDE EV. FELTOLKAT FÖRDÖMANDE.]

I do understand if cultural sometimes hinders from solving problems in an easy way. Because it perhaps isn't polite to talk about quality problems long term over years like this. Still for a daring engaged person it is a solid career path.

NU KORREKT ARTIGT GER PEKAR JAG PÅ VILKA SOM LÖSNINGAR KAN VARA SVARET FÖR: OCH SOM ETT TREVLIGT AVSLUT PÅ DIALOG TROTS FÖGA KONKRET VÄRDE FÖR MIG HUR DET KAN BYGGA MICROSOFT SÅVÄL SOM RickY.
DET SKAPAR JU DESSUTOM ETT INCITAMENT FÖR HONOM ATT VÅGA ENGAGERA SIG TROTS EV. KULTURELLA ARTIGHETS-HINDER INTERNT. DET KANSKE SLUTLIGEN LÖSER PROBLEMET SÅ JAG FÅR MITT DATA.]
y]

If I was you I would go over to the Internet Server people and give them the tips about file splitting.

Best regards
Hans


Det är inte alltid lätt att se till att avsluta dialoger när man över det man tycker mindre än vettigt irriterat har uttryckt sig med. Men det är vad jag tycker är viktigt att försöka få till vana.. För mig tog det några år att klara det bra som här regelmässigt. Det är vad som gör hela världen lite trevligare och snällare. En Bamse-snäll artighet. Inspirerande andra vidare.


Kanske är Ricky den som visar sig vara nästa affärsområdeschef för allt internet-server och cloud-relaterat på Microsoft? Vem vet. Om så tror jag att han minns hur trevlig artighet och ett snällt tips hjälpte honom tagande det som vana själv. Och du har vi en snällare accepterande värld där man trots dålighet och underprestation alltid ser till att lämna ett avslutat trevligt avtryck så dom inte känner sig stressade ell ledsa. När man klagarska Bamse-inspirerade alltid snäla upp det hela så det inte blir jobbigt aggiterande. En massa spring stressat läggande ut en fil på Microsoft webbserver löser ju kanske heller ingenting. Hur bra blir det om det förstör det för dem en tid eller värre kanske stör uppdateringar av alla klienter så att 50% av itnernet dör. Genomtänkt arbete drivet av en lagom glad avkopplad mind-set ed mycket feel-good är vid dagens slut kanske inte ännu givet oss filen men i alla fall inte haft sönder hela Microsoft eller 1/2 av internet.


Otroligt kan man tycka kanske. Men det var ju som ingenting man reagerade egentligen på som självklart fel i vad jag skrev. Och då mår dom bra av en stor kram.

Microsoft: Okynnes-delning av data

Kanske. Vi får väl se om det faktiskt är nedladdningsbar. Men som det tycks att skicka abnorma mängder enskilda request efter att suttit och följt en FAQ över hur man ska koda en liten klient till det hela. Önskan att dela data men inte riktigt att vill dela det heller tydligt. Andra anledning än den jag sökte information om hos Microsoft kan så klart finnas. En väg att göra något av det så här fungerande i det interna skapande leverabel utan att just tillgängligheten kanske pekar på vid den här tiden tydligare kvalitetsproblem hos Bing (som idag är ofantligt bättre) eller kanske samplings-tänkandet. Kanske var en idé med det ursprungligen också som en ortgonal QA-view ej direkt från resultaten (Bing vs Google: Högvärdes (sökmotor) sökningar).


Hur verifierar någon så mycket annat Google Research producerat härefter utifrån deras n-gram data? Det är ju framför allt i bred användning av ej få på stora delar av datat felen tenderar att visa sig.


Eller så tänker dehelt helt fel här. Här kan man tänka rätt och fel under förutsättning att datat är kvalitativt. Rätt är att erbjuda båda vägarna till det. Dessbättre är världen verkligen inte så att man för språk okategoriserade n-gram representationer behöver anstränga sig för dem. Nu börjar vi ju tillochmed av och till se dem närmare i särskilda ämnesområden:



Jag tycker det är lika bra ärligt säga vad man tycker till dem så kanske något rättas till. Det är som jag skrev att mer osynligt och orefererat i hela domänen frekvens av n-gram på långt kortare siffror än de erbjuder här får man leta efter. Dessutom som jag ser på det var det många år sedan man blev bjuden på någon media resa till Kalifornien (och det slutade illa några år senare när någon ännu okänd sociopatisk student på universitetet snattade silverpennan när jag var där för föreläsning krypteringskursen jag köpte). Och kan man nu inte ens ladda ner CSV filer utan att sitta och koda någon särskild liten applikation i Visual Studio efter att läst in sig på den rekommenderade sidan om själva standarden i Wikipedia ser jag som inte Norbert Wiener meningsfullhet här: Vad är varumärket Microsoft för mig? Vilka problem kan deras lösningar få att försvinna för mig? Och är priset vad jag är beredd att acceptera. 5-gram corpus att vikta in med övriga - men ej kritiskt. Jag kan ta nedladdning av några hundra till tusen filer men jag tänker inte sitta och skicka miljoner på miljoner enskilda requests månad för månad.


Det är lätt komiskt i hur meningslöst lite dumt. Så egen från världen i den här domänen. En idé om nu ej förklarat på annat sätt om att skapa för sig själv och de som är intresserade att använda deras API för att förnöja team-känsla med Microsoft kan skapande idén hos dem att sådan användning adderar värde för bredare marknadsföring. Men reducerande där så lär det väl knappast vara lösning. Då tror jag mer på deras stora reklam-kampanjer för The Cloud (om den nu faktiskt levererar fungerande när använd och som vi förstår från den här händelsen: Är rimlig att kunna börja använda i tid för särskilda standarder, särskilda utvecklingsmiljöer m.m. redundant ingen annan på nätet verkar kräva för att använda deras API:er - En url brukar fungera bra). Bara dåligt.


Komplettering: Här kom ett svar. Det verkar lovande. Snabbt såväl som inriktad på att lösa problemet. Gav en fin sammanfattning av vad jag skrev men utan min upplevelse som jag ju också kände till innan. Kanske ska jag roa mig lite runt det här och e-posta någon helt borta från det här så det blir förvirrat hos dem. Någon kulturbärare kanske och allmänt engagerad kanske. Ett enkelt svar vore förstås rent allmänt att hänvisa till någon enkel begriplig policy runt datakvalitet. Det lär tänker jag kunna spara lite tid såväl som kanske göra den egna organisationen smidigare också. Då har man alla svar om det där.


Hans Husman
18:31 (0 minuter sedan)

till Ricky
If I can get the data from it without taking months sending abnormal amounts of requests.

And it like any other API I used is functional from a url without installing this Visual Studio or something similar.

It isn't for an additional set non focused something I plan to start a small project of writing some little gui app to sit and view a few months.

Best regards
Hans

Och Microsoft uppmuntrar till att se alla deras teknik-kunniga som ute i Microsoft-samhället. De är uttalat av Microsoft i filosofi offentliga personer när relevant för deras teknikområde. Komplettering: Och nu också verifierat att minnet är rätt från flera år gamla anteckningar. Rätt från hästens dåvarande mule i USA.


2015-05-19 18:12 GMT+02:00 Ricky Loynd :
Hi Hans,

Our service does not provide for download of the N-gram files or the data used to generate them. Please let us know if you would like an access token for the service.

Ricky Loynd

från: Hans Husman 
till: webngram@microsoft.com
datum: 19 maj 2015 18:02
ämne: Token / CSV
skickat från: gmail.com

till webngram 
I am not sure at all I want the token if it is a lot
of work turning out to be slow since I really
would need if woth the all data. 

I feel sceptical why I can not download it as files.
Like it might have problems or that youy have problems
handling large file downloads from your services.

Verifying it regardless of articles I noticed perhaps isnt easy here.

That one easily find all other sharing large ngram sets while it is
extremly non-obvious probably for anyone might be related this or
that your search service on research didn't give any results for n-gram.

Had I not previous ready through your data to last page shared I would not knew of it.

If this service do function to download without hours of useless works taking
months if at all to get down. Really do not bother with it.

Best regards

Det duger verkligen inte att sitta och dumhålla på data.

Betrott samarbete: EU och Kina - IPv6 och The Internet of Things

Strategin partiet bestämt och Xinhua gjort klart för alla propagandister kan fungera bra. Jag tror verkligen att mellan intresse av trevligt "bra" samarbetsprojekt eller innovativa små forskningsprojekt och positiva nyheter gillad i omvärlden är det lätt såväl när standarder ska göras verklighet eller skapas (här blir det ibland amoraliskt om man inte tänker sig för) eller man vill göra ekonomi.



Så jag utliserade IPv4 och en sökmotor läsande på World Wide Web vad Kina och EU redan samarbetar kring läsande djupare på första träffen relaterad kritisk infrastruktur: Internet of Things. Jag var lite sugen på att söka längre och se vad man kanske redan samarbetar med relaterat IPv& eller i övrigt när det kommer till mer begripligt kritisk infrastruktur: Web of Energy och allt runt nätverkshantering av energiförsörjning (sunt och bra för att skapa effektivitet: Men farligt om man är godtrogen eller amoraliskt ej tänker längre än några smalt efterfrågade leverabler). Internet of Things fick emellertid räcka. Dessutom har vi ju diskuterat energi frågorna 2009 såväl några enstaka gånger uppföljt (svenska generator-stationer fick vi ju senare reda på hade remote-kontroll som i princip bara var att slå på med viss access lokalt när systemen av andra inköpare av det samma säkerhetstestade: Jag tvivlar inte på att det är hanterat idag givet Beredskapsmyndigheten eller vad den numera kallas efter namnbyte de kan ha gjort tycker jag mig minnas).


Samarbete i samhällsviktig infrastruktur

Var detta slutligen hamnar i konkret verklighet återstår för mig att veta (även om det knappast är långt borta):



Dokumentet ovan tror jag innebär om skarpt stödjande Internet-of Things från i dokumentet indikerat. Även om mycket information som också saknas om vad de egentligen håller gör förutom att samarbeta kring en standard som har att göra med produkter man kommer importera från Kina.


  • Trust har etablerats mellan resp. nod.
  • Resp. i den mening man lägger i sensor kan agera, förstå och verifiera klient-noder.
  • D.v.s. görande det funktionellt för exportlandet Kina att kanske hantera (andra lösningar hade fungerat lika bra med eller utna ipv6) att hantera de adresser man ger produkterna ut från fabrik.
  • Och tror jag revokera och stänga ner dem.
  • Tagande ett ansvar för mappning i EU mellan initial adressering och tilldelad adress.
  • Därför att man har direkt kontakt där resp. litar på varandra.

Vad som är problematiskt med det är att Internet of Things är tänkt för att ge mer eller mindre allt som säljs en adressering även om så av den önskat eller automatiserat möjlighet att adresseras trådlöst eller för den delen via tråd mot internet.


Föga trust och förtroende gavs diktaturen för utställande av X.509 certifikat primärt inte avsedda för TSL (SSL) relaterat klientens - EU medborgarens ex. möjlighet att verifiering server man kommunicerar med. Likväl:



Fast jag är mindre säker på att trust i någon av X.509 (och betrodda kataloger i X.500) är etablerat här. Mer en rent tekniskt hantering mellan noderna. Vilket gör möjlighet att delegera möjlighet att se såväl som att konfigurera hur faktiska entiteter - företag, personers produkter när de ställer in dem om alls möjligt - ser på och accepterar eller dör alt. använder alternativ möjlighet om görligt infrastrukturen för adresseringen.


Jag tror detta innebär att klienter ibland kan se att saker reds ut av Big Red medan det ofta nog verkar vara ett samarbetande standardiserat teknik projekt hos EU vars sensorer engagerat sig: Eller indirekt via de affärssamarbeten som etableras såväl som de cross-EU-China existerande samarbeten rörande nätverks-analys ochstruktu där den pratar vidare med auktoriteten diktaturen har hand om hållande information om allt möjligt relaterat exportprodukter.


Föga i det sista kan man tycka ska vara nödvändigt. Men det är så det kommer bli. Det är så de alltid vill ha det på internet. Och i praktiskt med EU kan det komma ner till om det strider mot en etablerad standard: Om inte kan interaktion göra en implicit-samarbetsstandard till vad som bit för bit kan byggas upp.


Sedan om fem år för man vara beredd på att saker man handlat kan revokeras som tillåten nod som får tilldelas IP-adresser. Åtminstone om de blir riktigt agiterade och överdrivet "paranoid-föregripande" och försöker trycka ut allt i närheten av kanske riktat demokratiskt ut från nät och telefoni här såväl som där. Beror lite på hur motiverade de är. Krig och konflikt är en annan fråga: Paradoxalt kan det här vara lättare att hantera medan det tidigare kan komma mer överraskande för den ej reflekterande.


Lösningen är följande:


  • Inget relaterat viktig infrastruktur ska någonsin lita på något kinesiskt.
  • Ej internet.
  • Ej energiförsörjning.
  • Ej mobiltelefoni.
  • Ej nätverks-grunkor med remote-administration när man ringer och behöver hjälp.
  • Ingenting.

Allt annat är möjlighet att remote billigt energieffektivt sprida kaos och göra skada när diktatur så bedömer det från sitt perspektiv av en minoritet i ett land utanför lag och rätt nationellt såväl som internationellt.


Redan mer normala tekniksamarbeten protokollstack, referens-implementationer m.m. är vad som ska göras med respekt av oss. Problem finns typiskt att hitta i kod och rörande etablering trust såväl som kommunikationsprotokollen i övrigt är kod mycket värre komplext än normalt.


OpenSSL indikerade jag av och till genom åren som jag mindes det från när jag implementerade delar av SPKM, lade till SSL i applikationer och lite små saker genom åren (om än ett antal år sedan sist). Och jag tror att jag tidigt 2008 rent av med bättre minne skrev om var ungefär det kan ha varit. Som jag tycker mig minnas från förra året (eller mer ev. året innan) påpekade någon för mig att ungefär det man uppfattade bakåt men jag såg fanns i något hittat i projektet eller något runt om det. Men innebär det att inte fler problem finns? Nej. Komplex kod. Oerhört. Och att koda krypteringsprotokoll i dom här domänerna är så djävligt att det kommer inte inträffa att något alternativt med samma räckvidd ut i var och varannan appliance eller produkt med SSL kommer. Redan koden i det användande det mer fritt kodande annat med det är plågsam som började komma med större ålder säkert relaterad till att jag slutade med det. Hundra tals define omman vandrar koden är inte onormalt om inget radikalt omkodning (knappast) gjorts sedan jag tittade sist kanske 2004.


Så man behöver vara skeptisk. Och förutsättande att samarbeten även i teknik är vad som söks efter möjlighet att ta vidare till potentiella vapen. Och det är idag knappast just OpenSSL som är det mer potentiella vapnet.


Intensitet: Positivt och Negativt i engelskan

Är vi motiverade tenderar de flesta oftast att också hantera mer problematiska eller tråkiga uppgifter såväl som information. P.s.s. när vi läser eller uttrycker information i språket reducerar bias åt snabbare process av positiva uttryck jämfört med för negativ information när initial motivation (eller om vi så vill "riktad intensitet").


Generellt för de flesta språks information samplingsbar så att säga (jag kan tänka mig att om man tar syriska barns skoluppsatser som corpus ser bias annorlunda ut) har vi därför att vardag som vi definierar vår normalitet (kanske besläktat med hur också svåra handikapp från olyckor m.m. ofta efter en tids anpassning svänger in i psyket till ungefär samma tillfredsställelse i vardagens flesta tidsintervall) ett bias mot positiva uttryck.


En alternativ förklaring till fenomenet (i citatet inte mer eller mindre bred eller djup än den korta intuitiva jag gav för hur fenomenet från ett praktiskt mätperspektiv av språk räcker som funktionell förklaring) mycket tidstypiskt för året det kommer ifrån är:


"For both languages, positive words had much faster processing times than negative words, when these included both peripheral and central (meaning) processing (t = 3.84, p < .001, for English; t=5.94, p < .001, for Chinese). This is consistent with the assumption that meanings of positive and negative words are derived via their associations with "approach" and "avoidance" behaviors, respectively (cf. Hoosain, 1977; Osgood, 1971). When response times for all 60 translation equivalents were compared, Chinese yielded faster times by an average of 140 msec (t =9.74, p < .00(1). That this was due to differences in central meaning processes is evident from the fact that the peripheral times were about the same for the two languages. This pattern of results also suggests that factors such as the motivation of the two groups of subjects or the speeds of pronunciation of the English versus Chinese responses were probably not material."



Från: Processing times for English and Chinese words
Rumjahn Hoosain, Charles E. Osgood.
Perception & Psychophysics, November 1983, Volume 34, Issue 6, pp 573-577

När nu skrämdumparna av emotionella värden var just för adjektiv kan man knappast kultur-historiskt ansvarsfullt citera någon annan: Tråkigt nog försöker mindre seriösa aktörer ta betalt från några hundra upp till ca 1000 kr för ett par upp till fyra sidor som minst - samma pris - för rena sido-publicering. Springer en av våra seriösare journalhus har mycket korrekt för en åldrad forsknings-artikel som denna gjort den fritt tillgänglig. För att uppmuntra alla moraliskt förvirrade publicister som försöker lura på folk sådant rent historisk kuriosa (Taylor & Francis Online - Ex. på det dum-giriga problem-gänget bland journalhusen med typiskt ofog) resp. artiklar fri-köpta av universiteten ger vi Springer ett betyg av 3.75 av 5 [Red. Redan ökad från 3.5 ursprungligen hittande mer bra äldre. /Hans] (mycket högt och högst på många år för denna bransch: 5 är bra och 3 är kvalitetsnivå vi borde kunna kräva: Tycks detta vara vana och ej undantag kan det bli bättre betyg senare för Springer).


D.v.s. man ser det (ganska jämförbart om man mät-praktiskt går från) omvänt: Ett generellt avoidance av det svåra annat än särskilt motiverad gör att vi förutom det praktiska undvikande otrevligt om ej nödvändigt också ogärna använder negativa ord. Dock om faran och risken ej är omedelbar för oss tänker jag att positivt effekt av positiva ord mer konkret relevanta för oss är en förklaring jag tror passar bättre in på mig när jag läser nyheter eller för åren när jag skrev åt media kommersiellt (i dom tekniska tidskrifterna föga emotionella så där uppenbart kanske: Säkerhetsrisker är utmärkta för stort läsarintresse om de är konkreta och verkliga för många motiverande medan mer positiva möjliggörande saker eller intressanta personer delande positiv-erfarenhet annars gav fler e-post).


Praktiskt kan jag dock från mig själv se avoidance när konkret för mig (ordna internet-datorn bättre-fungerande och ej ovettigt öppen som jag lät den vara givet att den satt separerad från alla viktiga datorer) när det är en massa bök. Än lägre tog det någon månad eller två innan det blev av att byta fönsterhanteraren till effektivare såväl som i gränssnitt bättre fungerande för mig LX. En massa Ubuntu och Linux bök läsande på nätet ett antal - tre - fyra kanske - timmar irriterande mig över att det inte bara fungerar.


Så hur skalar vi om från resp. perspektiv under antagande att vi har den första typen? I praktiskt kod använder jag en IDF-besläktad vikt (men ej beräknad från dokument utan snarare gränsskapen runt orden och med viss viktning från sannolikhet i ett delsteg). Emellertid i ett försök att ta ut en särskild vikt för att beskriva hur "konkreta" adjektiv är (ex. bör blue som färg vara mycket konkret medan unfair bör vara föga konkret) prövade jag också att istället använda en Zipf-liknande vikt.


Och som mycket förväntat är den i rank-mening (värden här är ej testade mot balans vilket oavsett IDF eller denna behöver göras när man tar olika vikter som kombineras men så här i toppen är det troligen ungefär som det skulle blivit) helt jämförbarbart. Zipf visar ju också kanske lättare att se likheten mot IDF i granskap runt orden visar även på ett rankförhållande mellan mening och rank: Och se gärna hur man betraktar mening i SUBTLEX (just problemet diskuterat i inlägget jag trodde mig slippa behöva lösa själv fick jag dock lösa själv: Likväl ovanligt gediget arbete när det kommer till lingvistiska vikter och kategoriseringar m.m. på en nivå av insats och motivation ej som sunt förväntat från många andra ämnesområden eller några år bakåt i detta ämne vanligt alls).


Först toppen när sorterad för EMI. Vi ser särskilt tydligt negativa men som vi här tittande med motivation just för det mycket begripligt kraftfulla - några är kanske lite otäcka - koncept.



Kolumn i mitten har i det Zipf-relaterade värdet vilket jag använde halv-fabrikats-värden från SUBTLEX-UK (ett riktat "USA-engelska"). Mycket rekommenderat för enkel ord-statistik: 1-gram.


Sista kolumnen är kombinationen mellan EMI till vänster och det Zipf-relateade måttet. Här eftersom jag endast beräknande prospekterande snarare än för drift-kod multiplicerar jag. Gör vi det närmare skarpare kod eller för återkommande vikter krävs gärna några fler operationer samtidigt som multiplikationen med så decimala värden gärna undviks av prestanda såväl för att reducera minne när vi laddar färdiga vikter (för adjektiv en icke-fråga givet endast beräkning av några tiotusen med för fler-grams-koncept där några miljoner eller fler ligger kostar det redan när databaserna ska byggas i tid det tar såväl som kostande på RAM när man håller troligt efterfrågande värden i minnet).


Nedan sortering vi nu efter sista kolumnen. D.v.s. vi sorterar fallande för värden som nu är funktion både av den genuina emotionella intensiteten såväl som det statistiska uttryck som ger en skattning av samma natur hos oss som ger positivt bias i engelskan (såväl som kinesiskan och sägs det många fler språk).



När jag som normalt istället använder min IDF som har mer av ursprung från ett corpus starkt i forskning är vi fortfarande tydligt i positivt men med den märkbara skillnaden att just positiva adjektiv man kanske kan uppleva som lite "gulliga" åker ner för märkbart fler "seriöst positiva" termer. Men alla positiva ord vi naturligt upplever som vanliga hamnar högt: Bias för dem finns där såväl som i det "berättande corpus" prioriterat (subscript från film var idén de byggde från vilket är tror jag ordentligt praktiskt enklare såväl lika sunt när vi önskar bedöma alla normala nyhetshändelser om än inte mer kunskapstungt språk).


Rörande EMI och vad den uttrycker kan sägas att den är ytterst indirekt beskrivande av inte minst nyhetshändelser som beskrivna i media. Vad vi kan kalla en projektion görs från resp. nyhets indikativa innehåll uttryckande polaritet och förs till centrala termer via dimensions-reduktioner individuella för resp. stycke (från det jag kallar DESCRIBE till vad jag kallar DO).


Att ex. bomb och war (och tror jag att bloody kom högt kanske med som jag tog skärmdumpar) kommer högt är därför ett uttryckt för intensiteten de uttrycks med.


Värdet av denna metod är att man kan följa förändring för koncepten (de vi gör projektion till). Vidare räkna framåt med dessa värden prospekterande framtiden antagande från olika perspektiv att värdena nu gäller och se vilken effekt det har (och mycket tillförlitligt ej längre in i tiden) att använda dessa värden som vedertagen verklighet för en tänkt framtida tidsenhet (ex. nästa dag eller om man samplar hårdare kommande halvdag: En dag är dock ganska lagom med medias rapport-hastighet) antagande att intensiteten d.v.s. hur uttryckta koncepten sedan är följer den förändring vi sett under den närastående pågående nyhetshändelsen (eller för något nytt som ej ännu enkelt särskiljs tydligt istället mer kostsamt skattande ut alla koncept vidare från enkel vinkel när nyhetshändelser bättre förstådda ej finns eller dom när existerande: Vilket för ett par miljoner koncept tar många timmar på en ej överdrivet kraftfull dator - På min äldsta levande dator jag har för internet nu kanske sju år gammal tog det med snabbare algoritm än nu och endast 100 - 120 000 koncept cirka längre tid än det tog innan nästa dags nyheter fanns att sampla och mäta men en tre år gammal dator tar det på fyra fem timmar). För kända nyhetshändelser om ej enorm komplexitet i vetande och associationer på stora avstånd efterfrågas tar det upp till 20 - 60 minuter.


För en ny skattad ex. dag tar vi nu de nya skattade värdena och räknar fritt vidare med för en ny dag. Ju längre tid vi gör det desto instabilare blir prediktionen av framtiden. En del särskilda underligheter kan förutom att man börjar avvika växande från framtiden som den visar sig vara kan också uppstå när nätet av koncept får associera mer kreativt för att försöka ta fram mer konkreta nyhetshändelser snarare än följa förändringar av befintliga: D.v.s ex- entiteter (kanske ett land eller organisation eller ett verktyg eller metod) som lite oväntat ej tidigare uttryckta i nyhetshändelsen engagerar sig eller engageras. Ett problematisk uttryck här var särskilt för att nätet kunde börja bli psykotiskt d.v.s. tänkande ej sunt kreativt utan just psykotiskt. Adderande man på emotionella preferenser för att roa sig och söka lösning på det kunde det ytterst talande bli exempelvis uppvisa irrationell paranoia när sökande risk och problem runt händelser. Det är mer eller mindre löst sedan något år: Emellertid finns alltid en avvägning mellan hur kreativt upptäckande intelligensen kan krävas att vara kontra risk för att det hamnar i psykotiska tillstånd.


Finns god tillgång hårddisk och beräkningskraft kan man helt enkelt behålla resp. tidigare delsteg (istället för som jag alltid gör kastande mer än något eller upp till tio om testkörande nya komponenter dem då de är väldigt stora) och backa tillståndet när psykotiskt automatiskt (säg att vi gör 1000 kreativt tänkande förändringar över hela nätet - också för koncept sista tiden ej uttryckta i media som vetskap teknik, vapensystem, forskning m.m. - innebär det att vi har cirka 10 - 20 miljoner koncept med minimum vikter beräknade cirka 20 st samt associationer till koncept de förekommit med i vetande bedömt relevant från nyheter resp. konkret i nyheter: Säg värst för länder som USA, Kina och liknande där det handlar endast i vetande om säg 10 000 associationer andra koncept vilket ger cirka om man skär så att endast topp 50 000 från något enkelt sparas i stegen cirka 500 MB eller om man sparar allt mer än 2 T per steg). Normalt krävs dock ej för något normalt ändamål att hela nätet troligt ska bli engagerad. Det är huvudsakligen när jag längre bak tittade på stora länder sökande möjliga vägar förändring de kanske kommer vandra som det varit aktuellt. Betraktar vi varje normalt företag och söker associationer rörande attityd-förändring, koncept de är känsliga för negativt, eller vad som tycks göra dem intressanta krävs mindre (också när vi tittar på internet-stora som Google djupare än "troende", resp. återkommande halv-professionellt följande utan grupper som kräver mer association därför att de ligger "lite under allt Google-vanligt" även om de kanske är mer talande om förändring än något som skrivit och följt dem fem år eller längre jämförbart).


En "fördjupning" in i det mer esoteriska runt emotionell intensitet och polaritet mellan exempelvis som här positive and negative:


Polaritet kinesiska jämfört engelska: Från Osgood till idag över till ... - Och var finns datat?

Refererar efterföljande Intensitet: Positivt och Negativt i engelskan (2015-05-19) där det äntligen blev att skriva något om det här.


Rörande Processing times for English and Chinese words ger ju Osgood kanske en alternativ väg att förklara fenomenet jag tittande över vad publicerat senare sista åren ej ser skulle avvika från data där även om man tycks ha samma preferens som Osgood från att se kinesiska skriftspråket som mer effektivt. Minns jag rätt har vi en relevant kommentar i artikel nedan (många artiklar jag laddat ner skrivna av Osgood är så abnormt svåra att hitta tillbaka till att de unikt är svåra att referera när det kommer till det tidiga arbetet just Osgoods mer mät-aktiva år: Allt senare av alla andra mätande samma koncept och idé mer exakt skymmande är just inte problemet: Vi återkommer till problemet sist):


Interpersonal verbs and interpersonal behavior
Charles E. Osgood,
University of Illinois,
Technical Report NO. 64 (68-9),
November 1968
"Communication, Cooperation, and Negotiation in Culturally Heterogeneous Groups Project",
Finansierat ARPA, MIL.


Själva polariteten i kulturen med dess språk är ju massiv i påverkan offentligt språk på olika "upplösningar" i närhet till individen åtminstone med början runt revolutionen i Kina (och antagligen med åtminstone jämförbara problem under den tidigare perioden av diktatur-styre även om de kaotiska åren med alla krigsherrar och lokal makt lär ha givit divergens och därför kanske förväntat mindre avtryck övergripande).

Effektiviteten där solid är ju inte minst för det positiva eller negativa d.v.s. polariserat i emotionell intensitet.

Betänk uttrycken av kraftfulla oerhört inrepeterade negativa stereotypen (enklast att möta i läsbar discourse i skildringar av kulturrevolutionen och kritiserande av varandra men förekommande än idag) såväl som krav på att uttrycka positiva stereotyper i perspektiv från diktaturen för att visa att man är korrekt troende och en av kommunist-gänget så att säga. Det senare kan tyckas irrationellt - och tycks så uppfattas av många som skildrat egna upplevelser - men värdet är samma som Islam har och haft adderande spridningskraft genom åren från:


  • Att troende publikt synligt gärna flera gånger dagligen ber.
  • Vi kan se det som marknadsföring.
  • Men bättre för individen reducerande stereotyper såväl som görande under tillväxt i ny-region religionen mer vardag: Normalitet.

Utlösande negativa stereotyper vet vi reducerar ner arbetsminne åtminstone om inte inlärd träning och kognitiv-kontroll ("presitgelöshet") gör att emotionell pay-load även om oerhört relevant för oss och reducerande ner oss otrevligt relativt någon som angriper oss får effekt (Prestigelöshet i Google-urval från bloggen).


När positivt polariserat - emotionellt starkt i kontext och relevant för oss - gör oss heller inte mer rationella om vi det får ha fri effekt. Vi kan förstå det från att det är bra att tänka till efter vi sett reklam i televisionen full med positiva uttryck av kraft, vitalitet, nöjda kunder, och ny innovativ teknik som kan lösa något understryket viktigt.


Det är tror jag ej korrekt att se ökad känslighet för detta som nödvändigtvis associerad intelligens - eller ens flytande intelligens / kapacitet arbetsminne - utan snarare som exempel på besläktat i effekt som kan vara aktivt här kan vi se att likhet mellan mätmiljö för studier finns med struktur och form hos i språket (eller konkret i vardag mer så i Kina än Taiwan) med det diktatoriska.


Och mer diffust att koncepten i sig kan vara mer polariserade relaterade detta.


Vad som är intressant och fick mig efter att roat mig att skumma åter en del av Osgoods artiklar är åtminstone följande (som jag reflekterade):


1. Eventuell skillnad mellan publikt språk och privat språk kanske större än förväntat från engelskan. En mer "diffus" källa till exempel på det mer emotionella i publikt språk sett från engelskan har vi i länken nedan. Bättre här så gör man så klart och/eller mätningar språk eller personer för att kunna se något utan att färgas ner med eget bias. Men jag har av och till förr genom åren när jag tittat förbi den tyckt den illustrativ samtidigt som den är det mer icke-politiska hos Xinhua och därmed kanske mindre störs av bias (och ev. vad man kan tycka sig se något även om man inte regelmässigt intresserat sig för själva området av emotionalitet i språk):



Mer om Xinhua och den uppdaterade femårs-planen:



Så är det: En klok diktatur ser till att hålla tillochmed sitt eget media-imperium förnöjt med en känsla av betydelse och självuppfyllande: Del av ett gemensamt inte potentiellt problematiskt polariserat koncept för någon. En bry till EU för att förklara regimen effektivare. Möjligen kan det ge något att jämföra nyheterna hos Xinhua med mindre men också statliga svenska nyhets-aktören SVT:



Skämtteckning jag gjorde relaterat EU och kinesisk media-penetration. Tidigare i Riktad information: Inducera det diskret paranoida och uppmuntra till hat (ex. med Xinhua och EU) - 2013-11-05.


2. Vidare trots att det ej är korrekt som generell princip att förenklat förklara från intelligens är det nu känt från engelska studier som en av få person-faktorer som påverkar här (schizofreni gör det något förvånande ej så om man tar ut polaritet med Osgoods-metoder: Associativa uttryck skiljer emellertid ut sig ordentligt här).


Kina har gått från mer landsbygd och mycket mindre av skolgång, möjlighet att läsa, ta del av nyheter m.m. som tränar upp och stärker kognitiv-förmåga hos populationer. Känt som .


Frågan är har vi en förändring jämfört med bakåt i tiden? Och mättes det ens meningsfullt mer i Kina under dom ännu kallare åren? Hur stor är förändringen?



3. Just nu söker man från diktaturen stärka polariteten. Det är vad som kan stärka dem. Det är också vad som kan utlösa emergens i våldsam förändring (kan fungera med lugn långa tidsperioder för att explodera). Givetvis är detta problematiskt men kanske krävs förändring i emergens för att Kina någonsin ska ta steget in i frihet snarare än att mer söka exportera sin ofrihet till omvärlden? Jag har därför lite kluvna känslor här: Dåligt och sämre väg än alla möjliga andra men ändå kanske lite bra i perspektiv (förutom lite dåligt samvete av att gilla att det kanske går mot emergens) av att sitta i Sverige utan att behöva se turbulensen skadande samhälle och alla akut döda.


Men låt oss återvända till privat och publikt språk. Vi kan ha en verklighet i ett kontext som arbetet. Och en i hemmet. Och en i en sportklubb eller dylikt. Jämför med Lunds talande studie illustrerande något tror jag viktigt om människan: Refererad i Saudiarabien är inte tyst längre utan gör höga ljud så att man tittar på dem.


Även om diktaturen sökt tränga in i den privata sfären i mening av internet och medier som via andra kanaler annars bättre hade nått in i Kina är det ett alternativt kontext. Att läsa där är ej som att sitta på lunch-rasten på statliga järn-industri-företaget och läsa någon kontra-revolutionär tidning från ett demokratiskt land och sedan diskutera med arbetskamraterna och chefen rörande kritiken i den om mindre frihet via ändringar lagar eller protester i Hong Kong.


Även med hög övervakning internet är trots datorernas möjligheter en annan komplexitet som föreligger. Många befintligt aktiva internet. Minst krävs att någon ska besöka samtliga eller göra planerat ingrepp arbetsplats. Jämfört med att direkt följa upp fascistiska åsikter på arbetsplatsen med för mindre förseelser negativ reward-återkoppling via arbetslöshet och svårighet att alls få arbete.


Men var om alls förändras polariteten? Ty om betänker emergens gäller ju att vi närmast förväntar just ökad polaritet kring där basala koncept. Men de kan i sig gynnas i reaktion och tolkning av vad som polariserar dem på att mer reflekterande lugnare med mindre polarisering betrakta mer information med större diversity / varians som formad av fritt intresse där intresset och dess effekt på den större populationen kan tänkas förändra de uttryck av polaritet vi började från. Och om så mätbart enklare från språkets uttryck utan krav att mäta direkt på individer: Om det finns något att sätta det i relation till.


Cross-culture psychology har ju idag preferens för det jag tycker mig minnas från min referensbok kallas cultural aware psychology. Osgood var så inne på att mäta kulturerna när det monumentala grundläggande arbetet gjorts och kanske hade viss tidig preferens här. Detta var ju också åren när såväl Kina var intressant nära kamrat och med betydelse i Taiwan. Andra förklaringar bör ha presenterats för honom givet att han djupt och talande men komprimerat berörde det i längre arbete i annat sammanhang. Sådant är lätt att missuppfatta och kanske förenklande han delvis förklaringen här accepterande bias mot polariteten som given och därefter kort uttrycka det som att resten kom från ökad effektivitet processande (högre emotionell intensitet ger ju högre effektivitet läsande och talande).


Här tror jag dock att frågan verkligen förutom utveckling områden föga skola alls till skola (ej påverkande Osgoods studie tror jag varande i Taiwan och baserad universitet) så mycket som etablering av språket avbildande hur det använts så enormt i publikt uttryckt dominant relativt det konkurrerande. Kina är gigantiskt. Bara revolutionstrupperna åren efter WII - i formering såväl i det "positiva" som direkta "negativa" effekter för att forma in dem - för i allt vad man idag tycker "normalt" gigantiska.


Frågan är vad vi har vi från de familjer av språk och kultur-studier implicita via finansiering från Kalla Krigets behov av förståelse. Så mycket av dessa äldre arbeten är tidsödande att få fatt i. Och problematiska att översätta till maskinläsbara format för mätvärden (för de bästa fallen att mycket man behöver göra förhand vid sidan om att själv-kopiera fält istället för att lita direkt på auto-konvertering: Och för just mätvärden gäller väldigt vanligt att det ligger som bilder ej trivialt att konvertera över automatiserat för mig i alla fall även om jag kan konvertera ut resten). Idag konverterade jag tre eller fyra sidor av mätvärden Osgoods tre grund-dimensioner (relaterade concreteness) även om jag dessbättre såg en alternativ väg till senare värden. Det tog ledigt ej trivial tid alls. Mycket av I0 istället för 10, 0 1 istället för 0.1. ~ m.m. skumt uttryckande något i konverteringen till PDF från kopieringsmaskiner relaterat fläckar eller punkter från anteckningar folk gjort i original-kopian.


Och så mycket av allt publicerat är ej tillgängligt internet. APA håller på försvarliga mängder här. Och torde skilt från exempelvis Dtic.mil som när de har rättigheter konverterar kopior de har och publicerar vara den aktör som kan göra sig besvär att publicera i vettigt format. Bara rena kopior torde förbättra enormt.


Och verkligen inte att om jag gjorde mig besvär att besöka universitetsbiblioteket att det löser något här.


Detta rörande sådant material såväl som senare är ju ett komptens-översiktsområde i sig. Stor insats för att få översikt på allt senare som inte atypiskt för vad intressant är kommer ganska sekundärt med väldigt begränsade mätningar i sig lite utspritt egentligen kanske tittande på något annat. Såväl som ofta vad som ger träffar med Google så långt man kan ta den men visar sig vara något rent strunt bekräftande någon gammal välkänd princip eller vad som gjort något med dator man lika gärna kan göra själv.


I perspektiv bara att hitta fram till norm-data för substantiv för Osgoods tre grund-dimensioner där cirka 6000 värden finns publicerade (framför allt längre bak) och läsbara på nätet är för mig och säkert vem som helst enormt komplext bara hittande artiklarna. Antalet är vad jag hittat av och till sökande när aktuellt periodvis flera år. 6000 noun. Inte 3000, inte 1000, inte 100.


Här kan det vara samma sak: Men värre därför att man för insatsen är mindre motiverad. Så är det inte vettigt enkelt ej vad jag lär betrakta den här vägen i alla fall om alls.


Det innebär inte att det inte kan visa sig intressant för någon som kan kinesiska kulturen, språket, såväl som forskningen gjord redan mycket bättre. Kanske bland dom kinesiska universiteten? Så kan man sunt sammanfattat och enkelt kanske läsa det om man minns att söka om ett halvår.


Eller om APA växer upp till en för globalt samhälle sund aktör ej för några tusenlappar per månad sitter och försöker sälja varenda gammal artikel allt relaterat dem kan ha publicerat. Det samma gäller resp. journal såväl som flera journalhus. Sådant får verkligen ingen att tycka att dessa är stora och bättre därför att de har samlat på sig alla dom här gamla artiklarna de vill sitta och hålla på. Tvärtom gör de oss skeptiska och vaksamma. Det är mer än vad som ej är moraliskt korrekt beteende ej samhälls-byggande riktigt.