-
Notifications
You must be signed in to change notification settings - Fork 17
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
UCS(UTF-8)とラテン文字の字幕に対応 #17
Conversation
ご提示のサンプルを再生して字幕パネルを見てみましたが、同じ文が繰り返し現れるのはなぜでしょう。 |
繰り返しになるのはロールアップモードによる挙動と思います。 |
すみません、字幕のPESデータを解析したところロールアップモードではなさそうです。(ロールアップモードならば同じ行を2回は送らないと思われます) |
詳しくありがとうございます。 一点気になるといえば、言語による決め打ちでラテンの判定をしていることです。 |
実運用では"jpn"と、一部のCS局で第2字幕に"eng"が使われているようです。 TVCaptionMod2字幕プラグインをSBTVD対応するにあたって参考にしたのがaribb24ライブラリの |
日本の放送を扱う場合において問題が起こる可能性はほぼ無いと思われるので、このままマージします。 |
ありがとうございました。振り仮名についてTVTestの対応として 本件とは直接関係なく補足です。videolan.orgの件のサンプルで字幕プラグイン(TVCaptionMod2やTVCaption3)の画面消去が上手くいかないと書きましたが、TR-B14の規定を正しく表現できていないためでした。 |
そちらの変更も取り入れたいと思います。 妙に空白が含まれていると思ったら、そんな手法があるんですね。 |
南米圏(SBTVD)およびフィリピン(UCS符号化方式)の字幕への対応を意図したコミットです。
直接の規格書はおそらく有料なので具体的に示すことはできないのですが、例えば
tsduck/tsduck#667
にて関連文書へのリンクが紹介されています。
UCS符号化方式についてはSTD-B24で規格されている(TCS(文字符号化方式)が1の場合)ので、このうちUTF-8の規定に沿って実装しています。※UTF-16についての規定もあります(おそらく採用例なし)が必ずByteOrderMarkがつくとされています。
(違法でない範囲での)サンプルデータは南米だと例えば
https://streams.videolan.org の streams/ts/ARIB/ にあります。TVTestで試験する場合、パネルの字幕表示は現状小さい文字が振り仮名扱いになるため設定の調整が必要です。フィリピンについては残念ながら未発見です。
実のところTVTestをSBTVD等に対応させる必要があるかと問われると心苦しいのですが、個人的にUCS符号化方式の規定を活用したツールを作っていることもあり、対応してもらえるととても助かります。