新しいものを表示

s="pͪoͣnͬpͣoͥnͭpͣa͡inͥ"
s.encode("UTF-8").grapheme_clusters.size;
→10

参考文献><;
Ruby で文字数を数える - Qiita
qiita.com/Nabetani/items/93e9a

Ruby

s="pͪoͣnͬpͣoͥnͭpͣa͡inͥ"
s.encode("UTF-8").size;
→19
s.encode("UTF-16").size;
→40

どういうことなの・・・?><;

haraita-i部分はオマケ(?)であって独立した文字じゃないのか・・・><

C# で、pͪoͣnͬpͣoͥnͭpͣa͡inͥ で試したら、
String.Length
19

StringInfo.LengthInTextElements
10

UTF8.GetBytes().Length
28

になった><

C# は常にstringがUTF-16なのでそういう混乱起きなそう><
System.Console.WriteLine("𠮷野家".Length);
UTF-16のCharの数なので「4」

System.Console.WriteLine(new System.Globalization.StringInfo("𠮷野家").LengthInTextElements);
TextElementの数は「3」
System.Console.WriteLine(Encoding.UTF8.GetBytes("𠮷野家").Length);
UTF-8のバイト列の長さでは「10」

orange さんがブースト

C# の場合どうなんだろうと思って調べてみたら、text elementsって表現してた><

StringInfo.LengthInTextElements Property (System.Globalization) | Microsoft Learn learn.microsoft.com/en-us/dotn

"The number of base characters, surrogate pairs, and combining character sequences in this StringInfo object."

orange さんがブースト

にしても UTF-n の # of code unit を「文字数」と表現するのは典型的な良くない表現では……

スレッドを表示
orange さんがブースト

「文字数」は code unit を数えているということでいいんですか、だったらバイト数数えてるのと大差なくない? (過言)

orange さんがブースト

つちよしはUTF-16はサロゲートペアの2文字に化けるよ

スレッドを表示
orange さんがブースト

String#encode (Ruby 3.3 リファレンスマニュアル)
docs.ruby-lang.org/ja/latest/m

> encode(encoding, **options) -> String

String#length (Ruby 3.3 リファレンスマニュアル)
docs.ruby-lang.org/ja/latest/m

> 文字列の文字数を返します。

おいおいおい何もわかんねえぞ

orange さんがブースト
orange さんがブースト
orange さんがブースト

Rubyならどっちもおっけー!!

$ ruby -e 's="𠮷野家";p s.encode("UTF-8").size;p s.encode("UTF-16").size'
3
4

神宮外苑再開発 “人権に悪影響の可能性”国連の作業部会 公表 | NHK | 国連 www3.nhk.or.jp/news/html/20240

05月26日
静岡県知事選 出口調査の結果|NHK 静岡県のニュース www3.nhk.or.jp/lnews/shizuoka/

ちなみにオレンジは、リニア問題のこのルートへの懸念自体、ルート決定前から「長野県の回し者」とか馬鹿にされながらも主張してたし、決定した時にも「掘れるものなら掘ってみろ!>< どうせ丹那と鍋立山と高熱随道が全部あわさったような状況に陥るから!><」的な事を2chに書いて、ひとりの土木オタクらしき人にだけ同意されてそれ以外からは、「Bルート厨くやしいのうwww」的な反応をされたこと忘れてない><(詳細は忘れた><;)

2024.05.08
リニア問題を放り投げて辞職した川勝知事の後継選挙戦…「浜松vs静岡」の対決が勃発していた(小林 一哉) | マネー現代 | 講談社 gendai.media/articles/-/129323

"...川勝知事が大風呂敷を広げてしまったリニア問題が解決に向かうかどうかは、どちらかが知事就任後に、これまで議論されてきたリニア問題が何だったかを正確に理解するところから始めるしかない。

つまり、リニア問題は争点にならない。..."

5/27
news.yahoo.co.jp/articles/e355

"リニア問題を解決させるためには、知事就任後に、正確な情報を基に、これまでの議論が何だったかをちゃんと理解するところから始めるべきであると、筆者はこれまで何度も強調してきた。
そんな中、筆者の懸念が現実のものとなる「事件」が起きた。"

何をどう懸念してたの?><;

オレンジがどのくらいびっくりしたかわかるかも?><;

2024/05/21
川勝知事が辞めた途端「リニア調査OK」に方針転換…「非科学的な議論」がバレた静岡県のお粗末会議の中身 これでは「科学者失格」としか言いようがない | PRESIDENT Online(プレジデントオンライン) president.jp/articles/-/81869?

"...ジャーナリストの小林一哉さんは「川勝知事がいなくなった途端、理由も説明せずに方針を180度変えるような専門部会は即刻解体すべきだ」という――"

居なくなったとたんに理由も説明せずに主張を180度変えるようなジャーナリストも即刻引退すべきだと思うよ!><;

古いものを表示
:realtek:

思考の /dev/null