新しいものを表示

地理が苦手すぎて東京、名古屋、大阪の位置すらわかってない人をそれなりに見かけるって事は、そのくらいわかんない人がたとえば「サンフランシスコはどこでしょう?><;」って聞いたらたとえばテキサス辺りを指差してもおかしくない気がするので、そのくらい地理が苦手なIT関連ライターが居たら、たとえば「Appleの輪っかはサンフランシスコベイエリアにある!」まで文字情報として記憶してても、それがどこだかわからず変な場所を指差したりするんでは説><(?)

ふと思ったけど、(地理が苦手すぎて)MSやらAppleやらGoogleやらがアメリカの西海岸にあるか東海岸にあるかもわからないIT系のライター(だけど地理以外の知識はまともな人)って居るんだろうか?><;

地理が苦手な人が世の中の地理的な要素をどう捉えてるかってわりと謎><

東根市って何県? ストリートビューの場所を当てる「Geoguessr」で遊びながら旅しよう - 石田賀津男の『酒の肴にPCゲーム』 - 窓の杜 forest.watch.impress.co.jp/doc

情報系の大学出身でインプレスでGame Watchの記者・編集をしてた人でもスペースニードル知らんのか・・・・><;(都市圏的にはMSのお膝元であるシアトルのシンボルだし、箱庭都市育成ゲームのランドマークにもそこそこ採用されてる気が><;)

日本では「クリスマスに予定が無い」はまだイジれるレベルだが、ヨーロッパでは真剣に気の毒に思われて大げさな事態になっていく - Togetter togetter.com/li/2280800

アメリカもらしいけど、オレンジがよく見てるイリノイのおじいさんトラックドライバーyoutuberの人は、おうちは家族と同居らしいけど去年のクリスマスは仕事してて、ユタのソルトレイク近郊のトラックストップ(ドライブイン)でクリスマス迎えてたしわりとトラックとまってた><
別のトラックドライバーyoutuberさんはクリスマス前におうち帰ってたけど、クリスマス直後からお仕事してて年越しもお仕事してたかも><(ただし、恋人と犬が一緒でお仕事してた><(一人での時と一緒にの時がある><))

くりまんじゅう | ナガノマーケット公式通販 nagano-market.jp/collections/k

くりまんじゅうさんだけのイラストの服は無いっぽい><

ガキ、ちいかわの服着て外出れるのズルすぎ→「大人がちいかわの服きて外出たらいかんのか?」 - Togetter togetter.com/li/2280721

(実際にあるのか知らないけど、)栗まんじゅうさんの服ならばむしろ大人向けというか呑兵衛向けっぽさ><

正式版(の機械翻訳)はこれっぽい?><

目標話者音響モデルによるモノラル対話記録のための同時音声認識と話者二値化【JST・京大機械翻訳】 | 文献情報 | J-GLOBAL 科学技術総合リンクセンター jglobal.jst.go.jp/detail?JGLOB

本文見たら、日立出身ていうか日立に所属してた時に書いたのだった><;

スレッドを表示

Deep Neural Networkに基づく日本語音声認識の基礎評価 | CiNii Research cir.nii.ac.jp/crid/15742318776

別の論文見ると、日立出身の人っぽい?><

話者識別音声認識に関する研究のMicrosoft Research所属の日本人研究者の人が筆頭のプレプリント見つけた><

[1909.08103] Simultaneous Speech Recognition and Speaker Diarization for Monaural Dialogue Recordings with Target-Speaker Acoustic Models arxiv.org/abs/1909.08103

デモじゃなく発表(講演?)全体の動画だけどこういうのも見つけた><

Target-speaker Methods for Speech Recognition – Desh Raj - YouTube youtube.com/watch?v=ewIwOp-o_p

なんか見つけた><

話者認識の概要 - 音声サービス - Azure AI services | Microsoft Learn learn.microsoft.com/ja-jp/azur

あと、研究レベルなら、映像に頼ることで映像内の身ぶり手振りから誰がしゃべってるか認識して音声分離するみたいなのがかなり前に出てた気がする><(超あやふや)

orange さんがブースト

話者の識別ができる文字起こしソフトってないかなぁ

youtubeの倍速再生使ったこと無いけど、単に速くして話し声も高速化しちゃうやつなのかも?><(一定サンプル毎に分割して、分割した単位で間引いていくやつ)

オレンジがアレンジして作った倍速音声再生システムは、音声信号の単に波形上の小さな値の場所を探してスキップの始点にして、そこから一定時間以内に大きくなる場所でなおかつ始点に近い値のサンプルの場所までを飛ばすみたいな単純化したやつだったはず><;
音楽再生するとバスドラムの音がする付近を中心に再生してそれ以外を少しずつ飛ばす感じになって、テンポが速くなってリズムも等間隔でバスドラ打ってる場所でもドンドンドドンドドンみたいに不等の謎のリズムになりつつ歌詞は聞き取れるという珍妙なものが奇跡的に出来た><;

倍速再生技術、たぶん国内企業で最初に量産製品化したの三洋電機のはず><

倍速再生、たしか日立とNHK辺り(超あやふやで自信無い)が1990年代に開発したやつは、無音部分を探してスキップするやつで、等速でも喋り声が遅くなるやつだった気がする><
何年か前にオレンジがそれを中途半端にアレンジして再現したもの作って、音楽再生して笑い転げたかも><

オレンジは小説の最初のやつしか読んだこと無い><(続編も読みたかったけど本の予算・・・><)

orange さんがブースト

銀河ヒッチハイクガイドの映画もあるのでそっちのほうがお勧めかなぁ.小説の方はわたしには読みにくかった.

古いものを表示
:realtek:

思考の /dev/null