Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

forced_alignment_with_torchaudio_tutorial 번역 #782

Merged
merged 7 commits into from
Jan 28, 2024

Conversation

kimgyujin
Copy link
Contributor

라이선스 동의

변경해주시는 내용에 BSD 3항 라이선스가 적용됨을 동의해주셔야 합니다.

더 자세한 내용은 기여하기 문서를 참고해주세요.

동의하시면 아래 [ ][x]로 만들어주세요.

  • 기여하기 문서를 확인하였으며, 본 PR 내용에 BSD 3항 라이선스가 적용됨에 동의합니다.

관련 이슈 번호

이 Pull Request와 관련있는 이슈 번호를 적어주세요.

이슈 또는 PR 번호 앞에 #을 붙이시면 제목을 바로 확인하실 수 있습니다. (예. #999 )

PR 종류

이 PR에 해당되는 종류 앞의 [ ][x]로 변경해주세요.

  • 오탈자를 수정하거나 번역을 개선하는 기여
  • 번역되지 않은 튜토리얼을 번역하는 기여
  • 공식 튜토리얼 내용을 반영하는 기여
  • 위 종류에 포함되지 않는 기여

PR 설명

이 PR로 무엇이 달라지는지 대략적으로 알려주세요.
https://tutorials.pytorch.kr/intermediate/forced_alignment_with_torchaudio_tutorial.html를 번역했습니다.
다만, 현재 레파지토리에 있는 코드는 단순히 리다이렉트 해주는 코드이기 때문에
리다이렉트 되는 https://pytorch.org/audio/stable/tutorials/forced_alignment_tutorial.html의 코드를 가져와서 추가한 후 이를 번역했습니다.
따라서, intermediate_source/forced_alignment_with_torchaudio_tutorial.py가 새롭게 추가가 됩니다.

Copy link
Member

@hyoyoung hyoyoung left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

긴 문서 번역하느라 고생하셨습니다.
전반적으로 잘되어있으나 몇가지 수정이 필요할거 같습니다
확인 부탁드립니다

wav2vec2을 이용한 강제 정렬
==============================

**Author**: `Moto Hira <[email protected]>`__
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

저자와 번역자 정보를 다른 페이지 참고해서 추가 부탁드립니다


**Author**: `Moto Hira <[email protected]>`__

이번 튜토리얼에서는 `CTC-Segmentation of Large Corpora for German End-to-end Speech Recognition <https://arxiv.org/abs/2007.09127>`__ 에서 설명한 CTC 분할 알고리즘을 이용하여 torchaudio를 가지고 정답 스크립트를 음성에 맞추는 방법에 대해 설명합니다.
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

문장 길이가 길어보이므로 적절히 줄내림을 추가 부탁드립니다


만약 본인만의 코퍼스에 대해 강제 정렬하려는 경우, :py:class:`torchaudio.pipelines.Wav2Vec2FABundle` 를 사용하는 것을 추천합니다.
이는 강제 정렬을 위해 특별히 훈련된 사전 훈련 모델과 함께 :py:func:`~torchaudio.functional.forced_align` 및 여러 함수를 결합하여 사용할 수 있게 합니다.
사용법에 대한 자세한 내용은 다국적 데이터를 위한 강제 정렬을 설명하는 `Forced alignment for multilingual data <forced_alignment_for_multilingual_data_tutorial.html>`__ 를 참조하세요.
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

다국적 데이터보다는 보통 다국어 데이터로 많이 사용하니 바꾸는건 어떨까요?

#
# 정렬 과정은 다음과 같습니다.
#
# 1. 오디오로부터 프레임별 라벨 확률을 추정한다.
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

오디오보다는 오디오 웨이브폼을 명시해주는건 어떨까요?

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

https://tutorials.pytorch.kr/recipes/recipes/loading_data_recipe.html 여길 보니깐 waveform을 파형이라고 번역을 했는데 오디오 파형이라고 하는 게 좋을 거 같은데 어떠실까요?

Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

제가 얘기한 단어보다 더 좋은 제안인거 같습니다

@hyoyoung
Copy link
Member

@kimgyujin
Copy link
Contributor Author

긴 문서 번역하느라 고생하셨습니다. 전반적으로 잘되어있으나 몇가지 수정이 필요할거 같습니다 확인 부탁드립니다

피드백 감사합니다! 피드백 주신 거 반영해서 수정하도록 하겠습니다!

Copy link
Member

@hyoyoung hyoyoung left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

전반적으로 잘되어있습니다

사소한 추가 피드백 확인 부탁드립니다

# ----------
#
# 이번 튜토리얼에서, torchaudio의 wav2vec2 모델을 사용하여 강제 정렬을 위한 CTC 분할을 수행하는 방법을 살펴보았습니다.
#
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

불필요한 newline이 포함되어있습니다 제거 부탁드립니다

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

529번째 줄 말씀하시는 걸로 이해했는데 맞을까요??

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

531번째 줄 말씀하신거였군요. 수정하도록 하겠습니다

# 좋습니다.

######################################################################
# 단어와 함께 분할을 병합
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Merge the segments into words
'여러 분할을 단어로 병합' 정도가 더 자연스럽지 않을까요?

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

넵! 제가 번역한 건 지금 보니 너무 어색하고 이상하네요...
phoneme을 발성한 구간을 합쳐서 한 단어를 발성한 구간으로 만들어가는 과정이기 때문에 '여러 분할을 단어로 병합'이 자연스러운 표현이 맞습니다. 오늘 밤에 수정하도록 하겠습니다. 피드백 감사합니다

# 결론
# ----------
#
# 이번 튜토리얼에서, torchaudio의 wav2vec2 모델을 사용하여 강제 정렬을 위한 CTC 분할을 수행하는 방법을 살펴보았습니다.
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

해당 줄에서 newline이 아직 포함되어있습니다 수정 부탁드립니다

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

많이 늦어서 죄송합니다. 해당 이슈 처리했습니다

@kimgyujin kimgyujin force-pushed the intermediate branch 3 times, most recently from f1730ec to e9ee85c Compare October 15, 2023 11:15
Copy link
Member

@hyoyoung hyoyoung left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

한가지 추가 수정 부탁드립니다

==============================

**Author**: `Moto Hira <[email protected]>`_
**번역**: `김규진 <http://github.com/kimgyujin/>`_
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

번역 앞에 공백이 있고 author는 저자로 번역하는게 더 좋을거 같습니다

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

수정 반영 했습니다. 피드백 감사합니다. 6d3fa96

Copy link
Member

@hyoyoung hyoyoung left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

good

@hyoyoung hyoyoung merged commit 1155711 into PyTorchKorea:master Jan 28, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants