Kategorier
Kultur Språk

H-orden

Mja, så där vansinnigt överraskande är väl nu inte Moderaternas partijargong, med tanke på ålderssegmentet i det aktuella fallet kring Delom Haffo och hans puerila avhyvling av minister Annika Strandhäll (S). Sådant lumparsnack förekommer helt naturligt i sådana grabbiga miljöer, och föreställningen var som bekant inte avsedd för en större publik. Samtidigt är det en yrkesetisk hållning att inte pladdra fritt när en mikrofon eller kamera finns närvarande, och Haffo får därmed ta konsekvenserna av sin oprofessionella svada.

Man skyller på nätet och dess förment hätska atmosfär, men sanningen är att sådant pladder alltid har förekommit i mer privata miljöer. Internet har bara råkat flytta ut köksbordet till den offentliga miljön, och man får därför ta det för vad det är, nämligen en ovanligt stor kaserndiskussion för öppen ridå.

Etablissemangsmedier benämner det kort och gott «näthat» och vill prompt förbjuda företeelsen med ett knippe passande lagar och genom att bussa Magdalena Ribbing på packet. Man vill helt enkelt ha tillbaka sitt åsiktsmonopol och sin funktion som samhällsdebattens grindvakt. Men det spelar ingen roll hur mycket man grinar från sina mediala elfenbenstorn, man får helt enkelt gilla läget med en ny verklighet.

På sätt och vis kan man hävda att samhällskontraktet är under omförhandling, vilket det i och för sig är kontinuerligt. Yngre generationer har alltid förfärat etablissemanget och föräldragenerationerna genom att använda ett i jämförelse med samtiden förråat språk, men sedermera har bruket normaliserats någorlunda och införlivats i vardagen. Könsord sattes inte på pränt för ett par generationer sedan, men är i dag allmängods även i seriös press, beroende av ämne (dock inte som skällsord, naturligtvis), liksom i populärkulturen. Samtidigt tenderar språkbruket att gå i vågor av vulgaritet och uppstramning.

Kvitterjargongen kräver starka uttryck för att man inte ska dränkas i kakafonin av miljoner andra kråkors samtidiga kraxande. Samtidigt är det en direkt form av skrift, som har mindre med eftertanke att göra. Sålunda har moderater som Thomas Böhlmark benämnt Nalin Pekgul (S) klappturk, ett epitet som för övrigt även nu ges Haffo i andra kanaler. Men jargongen känner inga partigränser, utan förekommer i alla led.

Det är gulligt att man vill införa politisk korrekthet bland fotbollsklackar som skriker rasistiska och andra tillmälen, liksom styra upp ohyfsade subkulturer på nätet. Men det kommer självklart aldrig att fungera, utan är en del av just sådana kulturer. Det städade språket hör till den traditionella offentligheten, och är då en del av ovan nämnda kontrakt: vi kliar visserligen inte varandras ryggar, men vi attackerar inte heller varandra verbalt.

Nå, mer intressant är då varför vissa ord är tabubelagda i det städade offentliga rummet. Man kanske tycker att det är självklart att hora är ett grovt förklenande epitet, och man överför då möjligen rollens samtida status (den har varierat) på en person. Men grunden till att hora är nedsättande har ursprungligen mer patriarkala orsaker, nämligen att horan åsidosätter en gift kvinnas exklusivitet och mannens motsvarande ägandeskap. Horan är därmed bara instrumental i att förklena en labil relation och därmed dess parter, som framställs som misslyckade.

Etymologiskt stammar ordet hora från protogermanskans *hōrǭ, och tidigare från protoindoeuropeiskans *kāro-, som inte betyder något annat än kär (med samma etymologi) eller älskad. En hora är alltså en älskling, vid sidan av. Föraktet kommer sig ytterst av ovan nämnda orsak, men egentligen är det väl horbocken som är den som bör fördömas, inte den som leder honom i frestelse? Personligen ser jag detta ord i en helt annan dager, och anser att det är en förolämpning mot alla horor att uppgradera en falsk och lismande politiker och maktmänniska som Strandhäll till en sådan status.

Bruket av svordomar varierar världen över. En del kulturer är mer sexuellt och fekalt lagda, andra mer religiöst. Sverige hör traditionellt till den senare typen, där ord som helvete, fan och jävlar anses vara tabubelagda uttryck. För att det ska vara på det sättet krävs givetvis en religiös fond, ty utan en sådan är begreppen tämligen meningslösa. I takt med att Sverige har sekulariserats har orden för dessa fantasibegrepp mycket riktigt devalverats, och räknas numera som högst beskedliga för att inte säga intetsägande kraftuttryck.

Helvete stammar annars från runsvenskans helvíti, som utgör två led. Hel är detsamma som dödsriket, och förekommer i begrepp som slå ihjäl (slå i hel), ytterst från protoindoeuropeiskans *ḱel-, som betyder dölja. Víti är å andra sidan runsvenska för bestraffning (jämför vite), och hela ordet betyder därmed Undervärldens bestraffning. Senare har ordet kommit att ersätta hel som begrepp för dödsriket i sig, och man kan därmed be någon att dra åt helvete (dra till hel), det vill säga önska livet av någon; i sanning en förolämpning.

I andra kulturer finns mer raffinerade sätt att förolämpa folk, exempelvis genom att tilltala en japan i fel person, medan en del av våra uttryck inte skulle fungera i exempelvis Kina. Dra åt helvete saknar helt motsvarighet, eftersom helvetet inte är en begreppsmässig del av buddismen. Ett ord som 小屄 (xiǎobī, lillfitta), är ett relativt klent och emellanåt helt familjärt uttryck, medan 王八蛋 (wángbadàn, hanrej, bedragen äkta man) och 傻屄 (shǎbī, dumfitta) hör till standardsvordomarna bland äldre respektive yngre generationer.

I slutändan är det bara ord, och det är väl mer intentionen som ska fördömas än ordvalet. Men även om vokabulären naturligtvis vidgas med kraftuttryck av olika slag, måste man ändå vinnlägga sig om att nyttja dem i rätt kontext, eftersom de bär på starka värderingar. Om Marshall Mathers (Eminem) kan svära sig fram i konsten, har även andra friheten att begagna sig av uttrycken, men under samma slags ansvar («Någon jävla ordning ska det va’ i ett parti»).

Kategorier
Kultur Språk

Mild, skamlig och feminin kona till fru

Kärt barn har många namn, inte minst kvinnor. Men varför heter det kvinna, och varifrån kommer alla dessa benämningar på olika synonymer? Här är kinesiskan betydligt trevligare i etymologisk mening, eftersom den har sin yttersta grund i enkla piktogram, som 女 (nǚ) för kvinna: det vertikala strecket är kroppen, och de två nedre korsade strecken armarna. Tecknet är således sidställt.

Tar man nu ett annat tecken för kvinna, 婦 (fù, förenklat 妇), ser man att tecknet 女 ingår som en så kallad radikal i kompositionen, medan det andra tecknet utgörs av en kvast (帚, zhǒu): en kvinna är en person som hanterar kvasten. Kinesiskan uttrycker således i sina tecken en form av klichéer kring egenskaper förknippade med det som avbildas.

Ta exempelvis tecknet 好 (hǎo, bra), som utgörs av en kvinna och ett barn: bra är när man har kvinna och barn. På samma sätt är tecknet 安 (ān, stilla; tyst) komponerat av en kvinna under ett tak, med given innebörd. Stoppa in två prickar i tecknet 女 och vi erhåller 母 (mǔ, mor), det vill säga en kvinna med två bröst, redo att dia avkomman. Tre kvinnor 姦 (jiān) är detsamma som otrohet.

Så långt kommer vi inte i svenskan, ty i grunden finns den urindoeuropeiska (PIE) rekonstruktionen *gʷḗn, som inte har någon annan betydelse än kvinna. Denna rekonstruktion kan sedan avledas i flera förgreningar, men av intresse här är två ytterligare rekonstruktioner i urgermanskan (PG): *kwenǭ (kvinna) och *kwēniz (fru).

Från PG erhåller vi sedan alla kända former i den germanska språkfamiljen. Fornengelskan (FE) använde således cwene, vilket sedermera har utvecklats i engelskans queen (drottning) och det numera utdöda quean, som är en mer nedsättande term för kvinna: prostituerad. Fornnordiskan (FN) tog en annan vändning i form av kona (kvinna; fru), ur vilken runsvenskans (RS) kona stammar.

Typiskt för RS och andra forngermanska språk är samma slags morfologiska grammatik som latinet uppvisar, nämligen böjning av substantiv efter genus och kasus. Utvecklingen mot modern svenska har präglats av att ersätta morfologi med analys i form av prepositioner, modala hjälpverb och andra konstruktioner. En komplexitet har därmed förbytts i en annan, och egentligen större; modern svenska är faktiskt inte enklare än forna varianter, utan betydligt grötigare.

Ordet kona böjdes således efter numerus (singular och plural), kasus (nominativ, ackusativ, dativ och genitiv), liksom efter bestämd och obestämd form, inalles sexton olika former. I obestämd form fanns singular kona (n.) och kono (a., d., g.) samt plural konor (n., a.), konom (d.) och kvinna (g.). Motsvarande böjningar i bestämd form gavs av konan (n.), konona (a.) kononne (d.) och kononnar (g.) i singular, samt konornar (n., a.), kononom (d.) och kvinnanna (g.) i plural.

Ordet kvinna (quinna) i modern form är således obestämd form av plural genitiv för kona, det vill säga kvinnors med en modern beteckning. Det vore intressant att veta hur just den udda formen kom att dominera i den förenklade grammatiken, med tanke på att grannländerna har bevarat kona/kone intakt i nominativ singular.

PIE är grunden för alla europeiska språk, med några få undantag som finska, ungerska och baskiska. De tre huvudfårorna utgörs därvid av germanska, romanska och slaviska språk, en uppdelning som även ligger till grund för politiska konflikter i historien. Fornnordiskan har här varit ett centrum för germansk kulturberikning i Europa, tack vare vikingarnas handel och vandel på de brittiska öarna och delar av kontinenten, liksom i Ryssland.

Latinet (L), liksom tidigare grekiskan, har utgjort ett annat och mer självklart centrum. PIE ligger här till grund för många gemensamma former i latin, PG och deras derivat, som PIE *kʷod → L quod, PG hwat → eng. what, sv. vad, och så vidare. PIE för kvinna, *gʷḗn, är således också representerat i latinet som cunnus, som dock har tagit en huvudsaklig betydelse av vulva.

En vanligare beteckning för kvinna på latin är istället härlett ur PIE *dʰeh₁m̥h₁néh₂ (den som ammar), vidareutvecklat i uritaliska (PI) fēmanā, och därifrån till latinets femina och vidare i franskans femme, italienskans femmina och spanskans fémina.

Spanskan använder dock vanligen ordet mujer för kvinna. Härledningen är PIE *(h₂)moldus (mjuk; svag), från roten *mel- (mild), och härifrån får vi latinets mollis (mjuk; mild; svag). Komparera adjektivet som mollior (mjukare; mildare; svagare), och vi får småningom avledningen mulier (kvinna; fru; fegis), det vill säga ett adjektiviserat substantiv för det täcka könet. I de spanska delarna av Romerska riket dominerade uppenbarligen ett vulgärlatin med mulier som föredragen term.

Italienskan använder på motsvarande sätt vanligen formen donna, härlett ur latinets domna, kort för domina (dam; husfru), femininum av dominus (härskare), avlett från domus (hem). PI *domos och PIE *dṓm ligger här i grunden, med rotordet *dem- (bygga). Det svenska ordet dam har sedermera etablerat sig på fransk grund (dame).

Med domina och avledda former har ordet kvinna således även kommit att beteckna en sekundär betydelse som dominerande härskarinna över en domän, det vill säga en fru. Latinets huvudsakliga ord för fru, uxor, är dock ett isolat, och stammar inte från PIE. Man kan här erinra sig att Rom var granne med etruskerna, vars språk var isolerat, och därmed hade en del andra influenser.

Vårt ord fru kommer ytterst från PIE *pro-w-(y)o-s, som betyder den främsta. I PG finns den maskulina formen *frawjaz (herre) och den feminina *frawjǭ (fru), med en inneboende betydelse av dominans. Gudaväsen som Frej och Freja är avledda från denna etymologi, och betyder alltså inget annat än herre respektive fru, som är närmast universella beteckningar för gudar.

Fornengelskan renderade detta som frowe, medan fornnordiskan tidigt hade formerna frú, frúa och frúwa (samt det skojsamma frugha). Svenskans fru, i betydelsen härskarinna, förnäm kvinna eller åtminstone gift kvinna, stammar från denna utveckling. Härskarinna i huset var husfrun, som sedermera kom att uttalas och skrivas hustru. Från medelhögtyskans vrouwe utvecklades i medelnytyskan diminutivformen vrouwicken, vilken sedermera tog formen frögdeken i fornsvenskan och således fröken i svenskan, som en beteckning för en ogift kvinna. Det är inte mer annorlunda än att engelska master i diminutiv är mistress.

De brittiska öarna påverkades starkt av keltiskt språkbruk, och har därför en annorlunda grund än kontinentala Europa. PIE *gʰʷíh₂bʰ-, som betyder skam, sköte eller vulva, utvecklades i PG *wībą, som betyder kvinna eller fru. Den senare betydelsen har kommit att dominera, som i FE wif och wyf, FN víf, FS vīf och sedermera svenskans viv, ett ord som inte längre är i allmänt bruk. Wife är dock den gängse beteckningen i engelskan.

Nå, om kvinna egentligen är en kona, är då en konung en konas unge? Det är en skämtsam form av vulgäretymologi, men faktum är att det ändå är en träffande beskrivning. Kung, eller konung, stammar från PG *kuningaz, som i sin tur är avlett från *kunją (familj; klan; släktskap) och *-ingaz (stammar från). PG *kunją avleds i sin tur från PIE *ǵenh₁-, ett verb med betydelsen producera, ge upphov till, eller föda. Kung betyder därför avkomling från en förnäm släkt.

PIE *ǵenh₁- (föda) har nu ingenting att göra med PIE *gʷḗn (kvinna), utan är helt olika rötter. Men samtidigt existerar i FN en form kwenungaR som benämning för en fruktbarhetsgudinna, det vill säga ordet härskarinna avlett från ordstammen för kvinna. Även de tidigaste skrivarna kunde för all del nog tillåta sig att konstruera fyndiga nyord, och det är helt säkert en sådan ordlek vi här har att göra med. Och helt säkert är att varje kung ytterst stammar från en kona.

Kategorier
Språk

De och dem och dom

Pseudodebatten är i full gång om huruvida subjekts- och objektsformerna de och dem bör ersättas med dom i båda instanserna. Belackarna inflikar att det egentligen inte är några svårigheter att lära sig skillnaden, på samma sätt som det är trivialt för ett infött öra att skilja på jag och mig.

Å andra sidan är de och dem inte ortografiskt kompatibla med uttalet, men detta kan förvisso också hävdas om och och att (som båda uttalas å). I skrift kan vi dock inte tillåta och och att att anta en gemensam form, eftersom det skulle medföra en försvårad förståelse för det uttryckta, utöver redan hopplösa förväxlingar (som «var med *och tävla»).

Men motsvarande aber föreligger inte för de och dem, som vanligen kan skiljas genom sammanhanget. Meningsbyggnaden blir inte riktigt lika fri, men det är en genomgående konsekvens av förenkling, som har präglat svenska språkets utveckling de senaste tusen åren.

Dom anses av hävd vara talspråk, samtidigt som det skriftliga bruket av de och dem är behäftat med en viss status. För att en dom-reform ska kunna bryta mark krävs att tongivande medier och en majoritet av författare etablerar bruket, som sedermera upphöjs till allmän norm.

Det är så utvecklingen alltid har skett, från avvecklingen av grammatiska genus och plurala verbformer till förenkling av stavning. Det finns i övrigt inget hinder i att subjekts- och objektsformer sammanfaller, som de redan gör för den och det (dativformen ty är utslocknad), utan allt kokar slutligen ner till det praktiska bruket bland personer med språket som verktyg.

Gamla hundar är svåra att lära att (inte *och) sitta, så personligen kommer jag nog inte att anamma en dom-reform. Men samtidigt har jag inga principiella invändningar mot en sådan utveckling, utan ser den nog snarare som naturlig, för att inte säga oundviklig i det längre perspektivet. Det är just den knepiga fonologin som kommer att fälla det slutliga avgörandet.

Kategorier
Kina Kultur Matematik Språk Vetenskap

Nio kapitel om räknekonsten (九章算術)

Jiǔ zhāng suànshù (九章算術) är titeln på en matematikbok kompilerad i Kina från 900-talet före vår tid (Zhou) fram till det första århundradet (Han). De nio kapitlen behandlar generell problemlösning i ett antal fält som areaberäkning, bråkdelsräkning, kvadrat- och kubrotsdragning, volymberäkning av sfärer och solider, samt linjära ekvationssystem.

Nio kapitel om räknekonsten spänner knappa 250 frågor, svar och förklaringar, kompilerade av en rad anonyma antika matematiker. Något större utbyte med Grekland och övriga Västvärlden förelåg inte vid denna tid, varför den kinesiska matematiken har utvecklats självständigt och oberoende.

Det kunde här vara av intresse att betrakta ett par av dessa problem för att bekanta oss med den tidens matematik och bildning. Mandarin talades inte på den tiden, men det kan underlätta att ange modernt uttal parallellt med översättningen.

Först har vi problem nummer 12 i kapitel 8 方程 (fāngchéng), «kvadratisk procedur» eller ekvationer med en modern term. Det gäller här ett spann om sex hästar i tre varianter – en förlöpare eller militärhäst, två mellanhästar samt tre eftersläpare – som på slätt underlag forslar sten, sammanlagt 120 förmodat likvärdiga bumlingar eller 40 per variantgrupp.

Spannet ska nu ta sig upp för en brant, och ingen av hästarna förmår då dra den last man kan hantera på slätt underlag. Lasten måste omfördelas, nämligen enligt följande kriterier: förlöparen lånar lasten av en mellanhäst; de två mellanhästarna lånar av en eftersläpare; och de tre eftersläparna lånar av förlöparen. I original:

今有武馬一匹,中馬二匹,下馬三匹,皆載四十石至阪,皆不能上。武馬借中馬一匹,中馬借下馬一匹,下馬借武馬一匹,乃皆上。問武、中、下馬一匹各力引幾何?

Jīn yǒu wǔmǎ yī pǐ, zhōngmǎ èr pǐ, xiàmǎ sān pǐ, jiē zài sìshí shí zhì bǎn, jiē bù néng shàng. Wǔmǎ jiè zhōngmǎ yī pǐ, zhōngmǎ jiè xiàmǎ yī pǐ, xiàmǎ jiè wǔmǎ yī pǐ, nǎi jiē shàng. Wèn wǔ-, zhōng-, xiàmǎ yī pǐ gè lì yǐn jǐ hé?

Nu har vi en förlöpare, två mellanhästar, och tre eftersläpare, var och en lastad med fyrtio stenar mot en sluttning, men ingen av dem förmår klättra upp. Förlöparen lånar av en mellanhäst, mellanhästarna av en eftersläpare, och eftersläparna av förlöparen, och först då kan de klättra upp. Frågan lyder hur mycket var och en av förlöpare, mellanhästar och eftersläpare förmår dra?

Med modern notation kan vi uttrycka problemet med variabler. Vi benämner här förlöparen (wǔmǎ) med w, mellanhästen (zhōngmǎ) med z, samt eftersläparen (xiàmǎ) med x. I det plana läget har vi då att w’ + 2z’ + 3x’ = 120, där vi använder apostrof för att markera ursprungstillståndet.

I det sluttande läget har vi istället w + 2z + 3x = L < 120, där L betecknar den last hästarna tillsammans förmår dra upp för branten. Vi har då följande ekvationssystem enligt de givna premisserna, där vi noterar att talet 40 bestäms av den maximala last varje hästgrupp kan bära:

w + z = 40 (1)
2z + x = 40 (2)
3x + w = 40 (3)

Allmänna metoder för att hantera bestämda system av det här slaget uppstod i vår del av världen först med Newton under den vetenskapliga revolutionen under 1600-talet, och vi benämner förfarandet numera gausselimination, efter matematikern Gauss. Kineserna var således närmare två årtusenden före Europa i att hantera linjära ekvationssystem.

Substitution i ekvationerna (1) och (3) ger att w = 40 – z och w = 40 – 3x, det vill säga att 40 – z = 40 – 3x, eller z = 3x (4).

Ur ekvation (2) får vi på samma sätt att x = 40 – 2z. Multiplicera med 3, och vi erhåller 3x = 120 – 6z = z, enligt (4).

120 – 6z = z ger då att 7z = 120, eller z = 120/7 = 17 1/7. Genom substitution i (4) har vi vidare att x = 1/3 · z = 1/3 · 120/7 = 40/7 = 5 5/7. På samma sätt är w = 40 – z = 40 – 17 1/7 = 22 6/7. Systemets lösning är då:

w = 22 6/7
z = 17 1/7
x = 5 5/7

Lasten bestäms enligt L = w + 2z + 3x = 22 6/7 + 2 · 17 1/7 + 3 · 5 5/7 = 71 23/7 = 74 2/7, eller 74.29 stenar, motsvarande 62 % av den ursprungliga lasten. Resonemanget förutsätter att man kan dela stenarna. I annat fall får man naturligtvis heltalslösningen w = 22, z = 17 och x = 5.

答曰:武馬一匹力引二十二石、七分石之六,中馬一匹力引十七石、七分石之一,下馬一匹力引五石、七分石之五。

術曰:如方程各置所借,以正負術入之。

Dá yuē: wǔmǎ yī pǐ lì yǐn èrshí’èr shí, qī fēn shí zhī liù, zhōngmǎ yī pǐ lì yǐn shíqī shí, qī fēn shí zhī yī, xiàmǎ yī pǐ lì yǐn wǔ shí, qī fēn shí zhī wǔ.

Svar: förlöparen förmår dra 22 6/7 stenar, en mellanhäst 17 1/7 stenar, och en eftersläpare 5 5/7 stenar.


Betrakta nu problem 20 i kapitel 9 勾股 (gōugǔ). Begreppet 勾股弦 (gōugǔxián) betecknar här de tre sidorna i en rätvinklig triangel, där 弦 (xián) eller 斜边 (xiébiān, lutande sida) med en modern term betecknar hypotenusan, och 勾 (gōu) respektive 股 (gǔ) avser de två kateterna i stigande storleksordning.

Problemet gäller att bestämma storleken på sidan av en stad av kvadratisk form, där staden har stadsportar i varje sidas centrumpunkt. 20 steg ut från den norra utgången finns ett träd. Om man tar 14 steg ut från den södra utgången, och därefter 1775 steg i västlig riktning, så kan man se trädet vid den norra porten. Frågan är således hur stor stadens sida är:

今有邑方不知大小,各中開門。出北門二十步有木。出南門十四步,折而西行一千七百七十五步見木。問邑方幾何?

Jīn yǒu yì fāng bù zhī dàxiǎo, gè zhōng kāi mén. Chū běimén èrshí bù yǒu mù. Chū nánmén shísì bù, zhé ér xīxíng yīqiān qībǎi qīshíwǔ bù jiàn mù. Wèn yì fāng jǐ hé?

Nu har vi en stad av kvadratisk form vars storlek inte är känd, i varje mitt finns en port. Tjugo steg utanför den norra porten finns ett träd. Går man ut fjorton steg från den södra porten, och viker av mot väster i 1775 steg ser man trädet. Frågan lyder: hur stor är stadens sida?

Gugou

I beaktande av figur har vi att förhållandet mellan sidorna AE och AC står i proportion till sidorna DE och BC, eller annorlunda uttryckt: AE/AC = DE/BC. Om sidan av staden betecknas x, har vi då att AE/AC = 20/(x + 20 +14), och DE/BC = ½ · x/1775, vilket ger 2 · 20 · 1775 = x · (x + 34) = x2 + 34x eller x2 + 34x – 71000 = 0. Detta är en andragradsekvation med den enda positiva lösningen x = -17 + √71289 = -17 + 267 = 250 steg.

答曰:二百五十步。

Dá yuē: èrbǎi wǔshí bù.

Svar: tvåhundrafemtio steg.

Nio kapitel om räknekonsten är ett av tio kanoniska matematikverk som ingick i repertoiren i det kejserliga examinationsprogrammet för lärde från Tang (600-tal) till Qing (1900-tal). Matematik i sin tur var en av de sex konsterna (六藝, liù yì), som utgjorde grunden för den klassiska kinesiska utbildningen. Problemen som har skissats här motsvarar idag ungefärligen gymnasiekompetens, men utgjorde i det historiska Kina närmast högskolenivå.

Kategorier
Kina Matematik Språk Vetenskap

Teckenfrekvens och Benfords lag

Betrakta en frekvenslista över kinesiska tecken. Typiskt alstras sådana genom att betrakta en relevant korpus, exempelvis en rad tidningar, romaner och vetenskapliga publikationer över en viss tidsperiod, varvid resultatet sammanställs ordnat efter förekomst.

I den valda frekvenslistan har dryga 193 miljoner tecken påträffats i korpusen, av vilka 9933 har befunnits vara unika. Som vanligt i dessa sammanhang är genitivmarkören 的 (de) överlägset vanligast, med knappt åtta miljoner förekomster, eller drygt 4 %. Tecknet 一 (yi) för talet ett hamnar på andra plats, följt av 是 (shi), verbet vara, samt negationen 不 (bu).

Om vi istället betraktar den första siffran i antalet förekomster för respektive tecken noterar vi ett intressant fenomen. Det vanligaste tecknet 的 förekommer 7 922 684 gånger, och den inledande siffran är här 7. Det näst vanligaste tecknet 一 förekommer 3 050 722 gånger, med inledande siffra 3. Tredje vanligaste tecknet 是 förekommer på samma sätt 2 615 490 gånger, med inledande siffra 2.

Frågan gäller således huruvida den inledande siffran i förekomsten för samtliga 9933 tecken i korpusen är likafördelade. I förstone kunde man tycka att siffrorna 1 till 9 borde vara fördelade likvärdigt med 11.11 % vardera, men man finner vid en genomgång att så inte är fallet. Det visar sig att den inledande siffran 1 är allra vanligast, med en frekvens om 35.4 %. Därefter följer övriga siffror i fallande skala, ned till siffran 9, med frekvensen 3.7 %.

Naivt intuitivt är resultatet överraskande, men fenomenet är känt sedan länge under benämningen Benfords lag. Många naturligt förekommande serier med stor variation följer Benfords lag med någorlunda precision, även om härledningen är mer abstrakt.

Omvänt kan man se Benfords lag som det ideala utfallet av en distribution, vilket är varför lagen används i kriminaltekniskt syfte för att utröna huruvida en bokföring är rimlig eller har manipulerats. Man skulle således även kunna bedöma kvaliteten på en frekvenslista med hänvisning till avvikelserna mot det ideala utfallet. Just denna frekvenslista är därmed förmodligen att anse som skaplig, men inte mer.