Kategori: Teknik

Skriva tecken på dator

Inläggsförfattare Av Niklas Dougherty
Inläggsdatum 2021-09-09T12:39:59+02:00 CEST

Frågan ställs med jämna mellanrum, nämligen hur man hanterar kinesiska, japanska och andra skriftsystem på en dator eller telefon. Det är kanske inte banalt eller trivialt, men ändå infinner sig hos mig varje gång en viss förvåning över att det inte hör till allmängodset.

En del föreställer sig alltjämt att det finns något slags kinesiskt tangentbord som inrymmer tiotusentals tecken, medan den enkla sanningen är att man nyttjar samma slag som du och jag. Med undantag för Taiwan, där man av geopolitiska skäl vägrade följa Folkrepublikens utveckling och istället anammade ett eget ickekommunistiskt fonetiskt alfabet kallat zhuyin fuhao (注音符号) eller bopomofo (ㄅㄆㄇㄈ) efter de inledande tecknen, som därför präglar tangentborden därstädes.

På fastlandet och i den övriga mandarintalande sfären nyttjar man istället pinyin (拼音) som grund, en modern (1958) romanisering som är avsevärt mer ljudriktig än tidigare system. Varje kinesiskt tecken kan således representeras med det latinska alfabetet, som till exempel 海 (hai, hav), 北 (bei, norr) och 水 (shui, vatten).

Uttalet, minus toner, följer i stort den romaniserade skriften, men det finns en del undantag och förenklingar som är värda att notera. Ett är att u egentligen är ü efter x, j, q och y, som i 去 (qu = qü, åka, gå), 许 (xu = xü, tillåta), 鱼 (yu = yü = ü, fisk) och 剧 (ju = jü, drama). Efter n anges ü explicit, som i 女 (nü, kvinna), eftersom n även kan följas av u, som i 怒 (nu, raseri) – för ü används emellertid den lediga bokstaven v i praktiken vid inmatning: 女 = nü = nv.

Ett annat undantag är att y och w inte alltid uttalas självständigt, utan är ett slags funktionella halvvokaler. I det tidigare exemplet har vi 鱼 (yu = yü = ü, fisk), som alltså uttalas som ü eller svenskt y. Men i sammansättning föreligger palatalisering, eller muljering, så att det inledande y antar ett svenskt j-liknande ljud: 鲨鱼 (shayu = shayü, haj). För exempelvis provinsen 云南 (Yunnan = Yünnan) förekommer vanligen palataliseringen självständigt i initialen, vilket motiverar bruket.

Alla är numera bekanta med staden Wuhan, som dock i en kinesisk kontext mest är känd av andra skäl, exempelvis för revolutionen 1911. Uttalet är emellertid inte som i statstelevisionen, utan vi har 武汉 (Wuhan = Uhan), det vill säga Oo-han. Att w ändå används beror på att det blir den bästa approximationen när u följs av en annan vokal, som i 我 (wo = uo, jag) eller 为 (wei = uei, för).

Ett ytterligare undantag är att -ian egentligen är -ien (-iän) i standarduttal, som i 天津 (Tianjin = Tienjin) och 鞭炮 (bianpao = bienpao, smällare), och att -uan egentligen är -uen (uän), som i 美元 (meiyuan = meiyuen, amerikansk dollar). I samma härad ligger kortformer för -ui = -uei, som i 水 (shui = shuei, vatten) och 桂 (Gui = Guei), och i kombination med föregående har vi således 瑞典 (Ruidian = Rueidien, Sverige). Lokalt uttal varierar, och kan ligga ortografiskt närmare pinyin. Pinyin är således utformat för att ha kortast möjliga form.

Med pinyin som grund kan man enkelt rendera tecken på skärm, nämligen genom att knappa in motsvarande romanisering för ett tecken eller ord, varvid man får ett antal förslag i ett kandidatfönster. De flesta stavelser i pinyin har nämligen ett antal motsvarigheter i tecken, som till exempel 傻 (sha, dum), 杀 (sha, döda), 鲨 (sha, haj). Det gäller även sammansatta ord, som 上海 (Shanghai) och 伤害 (shanghai, såra) – det är här tonerna kommer till sin rätt.

Kandidatfönster för *shanghai* i pinyin.

De första inmatningsmetoderna under 1980-talet var givetvis primitiva, men har sedermera raffinerats. Numera förekommer således prediktion på samma sätt som hos en sökmaskin, och metoden kan algoritmiskt välja rätt tecken och teckenkombinationer beroende av kontext. I Kina har man därtill AI-prediktion per molntjänst, vilket ytterligare raffinerar intelligensen i systemet. Metoden har vidare minne för användarens val av tecken.

Man skriver således inte enstaka tecken eller ord, utan hela eller delar av meningar i pinyin, för att erhålla bästa förslag per kontext. Man kan vid behov stega sig fram mellan olika delar av en mening för att korrigera enskilda tecken eller ord. Till yttermera visso behöver man inte alls skriva ut hela ord, utan det räcker med initialer, som gcd för 共产党 (gongchandang, kommunistpartiet), eller med «suddig pinyin» i allmänhet.

Prediktion vid kinesisk inmatning. *gcdsrmdxz* ger 共产党是人民的选择 (*gongchandang shi renmin de xuanze*, kommunistpartiet är folkets val).

En hel mening kan formas sålunda: gcdsrmdxz renderas som 共产党是人民的选择 (gongchandang shi renmin de xuanze, kommunistpartiet är folkets val). Av detta förstår vi att kinesiska på dator kan skrivas mycket snabbare än västerländska språk, vilket får sägas vara en oväntad utveckling.

Prediktion vid kinesisk inmatning med pinyin. Den fixar inte *mullvad* (鼹鼠, *yanshu*) i meningen, men väl att *pappa har fem söner* (爸爸有五个儿子, *baba you wuge erzi*).

En komplikation tycks vara att man alltjämt använder traditionella tecken på sina håll, till exempel i Hongkong och Taiwan, men det finns för det ändamålet parallella inmatningsmetoder för respektive tradition, och båda medger i övrigt bruk av såväl förenklade som traditionella tecken. Tecken som tecken, liksom.

Rendering på japanska nyttjar samma principer och har ungefär samma förutsättningar som kinesiska i övrigt. Tangentbord i Japan kan visserligen ha en särskild layout med alfabetet hiragana som komplement till den sedvanliga latinska utformningen, men det går alldeles utmärkt att nyttja så kallad rōmaji (ローマ字) med latinska bokstäver direkt – det är för övrigt den vanligaste metoden.

Japanska är något mer komplicerat än kinesiska, eftersom man utöver tecken har två hjälpalfabet i hiragana och katakana. Men även här löser intelligent prediktion problemet smärtfritt.

Texten ovan kommer från denna mangasnutt.

Även för japanska förekommer ett antal olika romaniseringar, men Hepburn är sedan länge den vanligast förekommande.Till skillnad från tidiga kinesiska romaniseringar är det förhållandevis ljudriktigt. Man har till exempel 彼女 (かのじょ, kanojo, hon), 切符 (きっぷ, kippu, biljett) och 日本 (にほん, Nihon, Japan).

Systemet väljer automatiskt mellan kanji (kinesiska tecken) och de två alfabeten, men man kan förstås överpröva beslutet vid behov. I själva verket kan man skriva med enbart hiragana eller katakana, men det underlättar inte läsningen – tecknen ger texten stadga.

Prediktion vid japansk inmatning. Förstahandsvalet 空き (*suki*, vara hungrig) ges av den tidigare existensen av お腹 (おなか, *onaka*, mage).

Kontexten bestämmer vidare vilka kanji som väljs, till exempel för すき (suki), som kan betyda 好き (suki, gilla), eller 空き (suki, vara hungrig, vara tom). Förekomsten av ordet お腹 (おなか, onaka, mage) i meningen ger då det naturliga valet 空き (suki, vara hungrig) i prediktionen.

Såväl kinesiska som japanska skrivs numera vanligen horisontellt från vänster till höger, men de flesta ordbehandlare medger traditionell vertikal skrift från höger till vänster, vanligen uppifrån och ned. Det påverkar inte inmatningen, utan är en fråga om typografi och grafisk utformning.

Vertikal rendering av japanska och kinesiska.

Koreanskan använder det inhemska alfabetet hangeul (한글), men eftersom det skrivs i termer av stavelseblock minner det en del om metoderna för kinesiska och japanska. Det beror i sin tur på att koreanska ursprungligen nyttjade kinesiska tecken i skrift, och att man därefter har behållit blockstrukturen – inte mindre än sextio procent av koreanska ord har nämligen kinesiskt ursprung.

Ett kinesiskt tecken som 山 (shan, berg) skrivs på koreanska således som 산 (san) snarare än löpande ㅅㅏㄴ som i västerländsk skrift. Därvid preciserar man fonetiken och gör renderingen betydligt mer kompakt. Av de tjugofyra bokstäverna kan man forma inte mindre än 11 172 stavelseblock, vilket gör att koreanska för en utomstående kan misstas för en logografisk teckenskrift.

Koreanska är en alfabetisk skrift, men med bevarad stavelsestruktur.

Koreanskan lider på samma sätt som kinesiskan av ett stort antal homonymer, det vill säga ord som uttalas likadant men har olika innebörd och rendering i tecken. I koreanskan är det dessutom fråga om homografer, i så måtto att de renderas identiskt med hangeul – därför får man emellanåt precisera med hanja (한자), det vill säga kinesiska tecken.

Tidigare nyttjade man likt japanskan en blandskrift, men numera använder man enbart hangeul, främst av historiska och politiska skäl – det koreanska språket trängdes undan under den japanska ockupationen. Koreanskan är som ett resultat mer svårläst än japanska och kinesiska, trots ett genialt alfabet.

Tidningen Joseon Ilbo (조선일보) använder *hanja* i logotypen (朝鮮日報), men även i artikeln (野, 야, ya, fält, opposition).

Även inmatning av koreanska är något mer komplicerat, eftersom man måste förhålla sig till stavelseblockens struktur, med allt vad det innebär i form av tomma platshållare. Vill man rendera namnet 李 (zh: Li, jp: Ri, ko: I) kan man således inte nöja sig med ㅣ, utan måste skriva 이, där ㅇ markerar en tyst platshållare.

Systemet hanterar i övrigt automatiskt strukturen i blocken, och även för koreanskan finns ett antal olika system för inmatning. Man kan använda en latiniserad variant om man vill, men det går avgjort fortare med en särskild koreansk layout som skiljer ut vokaler och konsonanter i vardera halvan.

Koreansk tangentlayout (Mac OS). Översta raden är ordprediktioner för aktuell text.

Kina Politik Teknik

Svampstäder

Inläggsförfattare Av Niklas Dougherty
Inläggsdatum 2021-08-22T12:08:42+02:00 CEST

Statstelevisionen berättar att miljö och klimat blir en allt viktigare fråga för väljarna, enligt en ny opinionsundersökning. Frågan klättrar till en femteplats, efter sjukvård, lag och ordning, invandring och skola, med fyrtiotre procents intresse.

Detta efter en sommar då sagda statstelevision mer eller mindre med ljus och lykta har jagat bränder, översvämningar och andra väderrelaterade fenomen världen över samt varvat skogsbränderna 2018 i repris (!) för att så säga om inte skapa nyheter så i vart fall göra ett gravt falskt urval, så kallad agendasättande journalistik.

Agendasättandet syns även i hur man i feministisk anda söker profilera damfotboll, det vill säga uppamma ett intresse som i grunden inte finns, och i hur man i kommunalteve (det vill säga Rapport) alltid, ständigt och jämt har någon vårdrelaterad nyhet. Den senare skattefinansierade agendan har fått ge vika under pandemin, men är nu på banan igen – syftet är helt enkelt att vården, en socialdemokratisk paradgren, ska fortsätta dominera väljarintresset.

Även klimatet är förstås en rödgrön hjärtefråga, och statstelevisionen har absolut inget annat syfte med sin dystopiska rapportering än att lobba för det rödgröna politiska intresset. Bevakningen präglas av reportage med ångestskapande bilder i syfte att jaga upp och skrämma människor, snarare än konstruktiva berättelser om att tackla problemen.

Det får således brinna, och vattnet får forsa. Det är sveda, värk, bränn och inget mer, möjligen med undantag för om statstelevisionens orakel Klimat-Greta har twittrat något i frågan. I den mån lösningar presenteras har de i regel miljöpartistisk prägel, och handlar om att sluta använda fossila bränslen och cement, det vill säga lösa upp civilisationen.

Det man inte berättar om är tekniska lösningar för att bemästra översvämningar med underjordiska bassänger, uppsugande grönområden, porösa sugande material med flera anordningar, som dessutom blir en färskvattenreservoar när det motsatta problemet med låga grundvattennivåer slår in.

Inte helt förvånande leder Kina även denna utveckling, vilket beror på att det är en civilisation byggd på kaotiskt vattenflöde. Kinas stora floder har under tusentals år svämmat över och orsakat död och svåra skador, och man har bemästrat flödet med ingenjörskonst. I modern tid innebär det dammar och slussar, men även svampstäder som dynamiskt suger åt sig vattenmassor när nederbörden är ovanligt stor.

Svampstäder är visserligen dyra, men det är också översvämningar och vattenbrist. Andra fördelar är även att värme som ackumuleras i storstäder kyls ned av lagrat vatten, och att man får en jämnare vattenekonomi. Nu är värme så att säga inget problem i Sverige, men vi kan definitivt dra nytta av övriga fördelar i alla större tätorter, istället för att förlita oss på urgamla och otillräckliga dräneringssystem.

Kultur Teknik Vetenskap

Interstellärt

Inläggsförfattare Av Niklas Dougherty
Inläggsdatum 2021-07-23T10:00:20+02:00 CEST

Föreställ dig en farkost byggd i rymden, utanför jordens gravitationsfält. Syftet med farkosten är att företa en resa till någon närbelägen stjärna, exempelvis Alfa Centauri på 4.37 ljusårs avstånd, för att se om systemet härbärgerar någon planet lämplig för mänsklig kolonisation.

Frågan är då vilka fysikaliska begränsningar som finns för en sådan resa, med avseende på restid, farkostens vikt, erforderlig bränslemängd, maximal hastighet som kan uppnås med mera. Man kan i förstone tänka sig konventionella drivmedel för raketer, i ett accelererat förlopp utan att ta hänsyn till inbromsning vid ankomsten.

Man kan här för enkelhetens skull också tänka sig att vår farkost finns i en gravitationsfri lagrangepunkt i jord–solsystemet, och att den vidare färden sker utan gravitationell påverkan. I verkligheten skulle man behöva lämna solsystemet för att få ett friktionsfritt förlopp, och i själva verket skulle man förstås nyttja solsystemet som en slunga för att få gratisskjuts. Det är perturbationer som dock inte är relevanta för vårt tankeexperiment.

Vårt system består således av en massa m(t), som omfattar såväl fordonet som dess bränsle, och som varierar med tiden allteftersom vi förbränner bränslet. Newtons andra lag ger en acceleration a = dv/dt = -F/m(t) = -Rv_e/m(t), där R betecknar ett konstant massflöde av nyttjat bränsle (kg/s) och v_e är utsläppshastigheten av sagda bränsle (m/s).

Om vi betecknar den ursprungliga massan för systemet m₀ och den slutliga massan efter att ha accelererat till marschfart m_f under tiden ∆T, kan det konstanta avgasflödet skrivas R = (m₀ – m_f)/∆T, som i detta konstanta förhållande är det samma som differentialen dm/dt. Termen dv/dt integrerar vi sålunda för att erhålla den uppnådda hastigheten: ∆v = ∫dv/dt = -v_e·∫1/m(t) dm/dt = [ln m] för intervallet [m₀, m_f].

∆v = v_e·ln(m₀ / m_f) är raketekvationen, och den bestämmer helt och hållet de fysikaliska villkoren för vår resa. Eftersom det är en resa med människor ombord kan vi tänka oss en bekväm acceleration om a = 1g = 9.8 m/s² för att simulera jordens gravitation. Kalkylen här är a = dv/dt = g, som ger hastigheten v(t) = ∫g dt = gt, samt distansen d(t) = ∫g dt = ½gt². Vilken hastighet vill vi nå?

Eftersom resan är 4.37 ljusår vill vi komma fram inom mänsklig livslängd. Med tio procent av ljushastigheten skulle det ta 43.7 år att företa resan, plus lite extra tid för acceleration och inbromsning. Med v = 0.1c = 3·10⁷ m/s får vi t = v/g = 35 dygn, en försumbar tid. Även relativistiska effekter är marginella.

Med ∆v = 0.1c kan vi även se vad det innebär för massförhållandena mellan farkost och bränsle, nämligen enligt ∆v = 0.1c = v_e·ln(m₀ / m_f). Termen v_e beror av teknik och bränsletyp, men i vårt antagande om konventionell drift med flytande syre och väte har vi v_e ≈ 4 400 m/s.

Det ger ∆v / v_e = ln(m₀ / m_f), eller m₀ = m_f··e^{∆v / v_e}. Om vi antar en ultraslimmad modul om m_f = 20 000 kg omfattande ett par individer och all utrustning som krävs för att driva farkosten och upprätthålla ett ekosystem under drygt fyrtio års tid, har vi med siffror att det totala initiala massystemet är m₀ ≈ 20000·e⁶⁸¹⁸ = 2·10⁴·10²⁹⁶¹ = 2·10²⁹⁶⁵ kg. Som en jämförelse är det observerbara universums massa 10⁵³ kg.

Om vi istället skulle nöja oss med en mer modest hastighet om 11 190 m/s, eller jordens flykthastighet, hade det räckt med 254 ton bränsle, eller 12.7 gånger modulens vikt, men då hade det å andra sidan tagit 117 000 år att tillryggalägga sagda sträcka.

Av detta förstår vi att interstellära resor inte är praktiskt möjliga med konventionell teknik, och det finns heller ingen möjlighet att eliminera raketekvationen. Den sätter en gräns för det möjliga, och kräver exponentiellt större mängder bränsle för högre hastigheter. Det är av den anledningen traditionell rymdfart inom solsystemet bedrivs med hjälp av gravitationella slungor, för att det annars skulle krävas så mycket mer bränsle.

Även om man kan spekulera i hypotetiska «fotonraketer» och andra slags konstruktioner för att överkomma raketekvationens barriärer, förblir det en formidabel utmaning att skicka farkoster mellan närbelägna stjärnor, och i praktiken omöjligt att bedriva längre äventyr i galaxen, i vart fall bemannade sådana. Raketekvationen är en fysikalisk gräns, inte en teknisk.

Härav följer också att det aldrig någonsin kommer att finnas något «moderskepp» redo att företa en invasion av jorden, och knappast heller någon mindre farkost i syfte att observera oss. Det senare skulle förutsätta en närbelägen civilisation, vilket i sig är en osannolik hypotes. Fysiken och oddsen är alltså inte på ufologernas sida.

Asien Kina Politik Taiwan Teknik USA

Elektroniskt kallt krig

Inläggsförfattare Av Niklas Dougherty
Inläggsdatum 2021-06-03T12:53:13+02:00 CEST

Världens beroende av en enda producent av avancerad halvledarteknik på Taiwan, några mil från Kinas kust, är ett betydligt värre problem än om en fullastad pråm blockerar Suez-kanalen. Ty utan TSMC stannar produktionen av mobiltelefoner och datorer, samt försvårar för bil- och andra industriers behov av kretskort. I flera år.

Taiwan – Republiken Kina – som sedan inbördeskriget existerar som en självstyrande stat utan att erkännas som en sådan, utan som formellt betraktas som en del av Kina, och i konstitutionell mening även själv gör anspråk på att företräda hela Kina. Taiwan, som beror av USA och dess flotta för sitt oberoende, och som gör stora inköp av amerikansk försvarsmateriel, även om utsikterna att stå emot en invasion är obefintliga.

Även om status quo råder sedan 1949 finns i både USA och Kina en oro över denna situation. USA vill därför flytta produktion från Taiwan till USA för att säkra framtida tillgång, samtidigt som man vill hindra Kina från att köpa chips, mjukvara och utrustning. Kina å sin sida är redo att skjuta till fantasiljarder i stöd till utveckling och forskning för att kunna komma ikapp och gå förbi, och därmed bli självförsöjande även på chips.

Detta är årtusendets drabbning, ett kallt krig om det tekniska världsherraväldet, i allt från AI och kvantdatorer till kretskort och genteknik. Det är som rymdkapplöpningen mellan USA och forna Sovjetunionen, men i mer total mening, omfattande allt.

Sådan knivskarp konkurrens på liv och död är visserligen nyttig i det att den tar fram det allra bästa på kortast möjliga tid, men den kommer också att ordna stor oreda kring standarder och annat som förenklar produktionen. Det är så att säga inte som VHS och Betamax, utan mer på protokollnivå.

Vem avgår med segern? Jag säger förstås tveklöst Kina, för att alla pilar pekar i den riktningen, och för att amerikanerna tar alldeles för lätt på saken, i den enfaldiga tron att man har ett överlägset system, att man har övertaget och så vidare.

Kina Politik Teknik USA

Luftherravälde: J-20/31 mot F-22/35

Inläggsförfattare Av Niklas Dougherty
Inläggsdatum 2021-05-01T07:17:06+02:00 CEST

I händelse av en het konflikt i Sydkinesiska sjön kommer flyget att spela en avgörande roll, eftersom det är den primära stridskraft USA har att tillgå på sina flytande fort och i sina baser. Man kan visserligen räkna med att Kina kommer att försöka sänka amerikanska hangarfartyg och jagare med skurar av missiler av typ Dongfeng, men man vet inte hur väl USA kan svara på en sådan attack.

Även USA har som bekant kapacitet att skicka iväg en stor svärm skrot mot lämpliga mål, även om man ännu inte har förmåga att sänka ett hangarfartyg. Kina har här fördel av att befinna sig på hemmaplan, med hela sin flotta och övriga stridskapacitet koncentrerad till närområdet, medan USA har en mer utspridd profil med begränsad arsenal. Kina har också en underlig «fiskemilis» bestående av sammanflätade fiskebåtar att sätta in för att fysiskt hindra amerikanska plåtschabrak av olika slag – man kan ju inte torpedera civila pråmar.

USA har å andra sidan fördel i krigsvana, eftersom man är i ständigt krig någonstans, medan Kina inte har utkämpat ett krig sedan en kort operation i Vietnam på 1970-talet. USA har också traditionellt haft det tekniska övertaget, men det är alltså här som balansen är på väg att förändras på allt fler områden.

Med avseende på stridsflyg har Kina och USA två typer vardera i femte generationen, medan Ryssland ståtar med en (Suchoj Su-57). Generationsskiften i denna genre är inte kosmetiska, utan innebär dramatiska skillnader – en enstaka JAS-39 Gripen (generation 4.5) kan således inte mäta sig med en F-35 eller en F-22, utan lär hamna på backen.

F-22 Raptor är här prototypen för generationen, med premiär redan 1997. Den mindre enmotoriga F-35 är av nyare slag, men kanske inte lika kraftfull – däremot är det en formidabel exportsuccé, med närmare femhundra byggda plan. Amerikanska flygvapnet förfogar över knappt tvåhundra F-22 och drygt hundra F-35, men de är förstås utspridda över världen.

Kinas motsvarigheter är dels Chengdu J-20 (歼-20, Jian / Förgöraren), även kallad Mäktiga draken (威龙, Weilong), och den lättare kusinen Shenyang J-31 (歼-31) Jaktfalken (鹘鹰, Guying), båda från början av 2010-talet. J-31 är avsedd för hangarfartyg, medan J-20 är mer landbaserad och med en överlägsen transporträckvidd om 6000 km.

Elaka tungor säger att J-20 är en kopia av F-22, och att kineserna helt enkelt har stulit designen. Säkerligen har man bedrivit sådant industrispionage – allt annat vore tjänstefel – men samtidigt sätter aerodynamikens lagar vissa gränser för hur dessa fordon kan ta sig ut om de ska prestera optimalt och ha smygteknik. Ekvationerna ger designen, även om de inte är identiska i vare sig utformning eller prestanda och funktion.

Samma röster hävdar för övrigt också att de amerikanska modellerna har övertaget och kan bemästra båda de kinesiska uppstickarna, men det är det faktiskt ingen som vet. J-20 och J-31 är båda av nyare slag, och de uppgraderas därtill ständigt – senast med ny inhemsk motor och en tvåsitsig variant för J-20. Om man får tro simuleringar har J-20 faktiskt övertaget.

Kina förfogar över närmare hundra J-20, och huvudsyftet med dem – utöver försvar – är nog egentligen inte att mäta sig med USA, utan med Taiwans armada av F-16 i fjärde generationen i händelse av en landstigningsoperation. Men även en stor mängd mindre kraftfulla plan får svårt att agera mot motståndare med smygteknik.