Improve: batch size setting and multi GPU inference with SentenceTransformers+DP #53

akiFQC · 2024-08-08T07:59:16Z

PR をマージした後の挙動の変化

バッチサイズを最適化して高速に埋め込みを計算したい
安定性のために、torchrun を使わずにGPU並列化を行いたい

挙動の変更を達成するために行ったこと

src/jmteb/embedders/base.pyのTextEmbedder に _chunk_size という変数を追加し、_chunk_size ごとに TextEmbedder.encodeを呼ぶように変更
src/jmteb/embedders/data_parallel_sbert_embedder.py追加し、sentence-transfermersでpytorchのDataParallelによる複数GPU推論が可能になった。
テストを追加

動作確認

テストが通ることを確認した
マージ先がdevブランチであることを確認した

…etting

lsz05 · 2024-08-09T03:06:07Z

tests/embedders/test_dp_sbert.py

+OUTPUT_DIM = 128
+
+
+class TestSentenceBertEmbedder:


Suggested change

class TestSentenceBertEmbedder:

class TestDPSentenceBertEmbedder:

lsz05 · 2024-08-09T03:14:09Z

src/jmteb/embedders/data_parallel_sbert_embedder.py

+
+    def _add_eos_func(self, text: str | list[str]) -> str | list[str]:
+        try:
+            eos_token = getattr(self.model.savetokenizer, "eos_token")


self.model.tokenizer?

lsz05 · 2024-08-09T03:18:01Z

起動時torchrunではなくpythonで起動すると理解合っていますでしょうか?

akiFQC · 2024-08-09T06:29:31Z

起動時torchrunではなくpythonで起動すると理解合っていますでしょうか?

はい。pythonで起動してください。

src/jmteb/embedders/data_parallel_sbert_embedder.py

lsz05

LGTMです！

lsz05 · 2024-08-09T20:14:44Z

src/jmteb/embedders/data_parallel_sbert_embedder.py

+        self.model = self.dp_model.sbert
+        if max_seq_length:
+            self.model.max_seq_length = max_seq_length
+        self.initital_batch_size = batch_size


self.initial_batch_sizeが使われていないような気がしますが

akiFQC added 14 commits August 7, 2024 15:25

use sbert embedder with encode_multi_process

4ffd114

add chunk_size_factor

7e8e031

fix chunk_size_factor

6fb4a6e

small fix chunk_size

c361727

format

2809731

Merge remote-tracking branch 'upstream/dev' into improve/batch_size_s…

7adb030

…etting

add: code and tests of multi-gpu inference with pytorch DP

62368bc

update init

b7376c0

debug DP

9508f3c

revert sbert embedder

b9a50c6

format

c6f079a

find_executable_batch_size

4261cf5

add comment

39f98a3

debug

abe4f88

akiFQC requested a review from lsz05 August 9, 2024 00:41

lsz05 reviewed Aug 9, 2024

View reviewed changes

fix to review

61aa4da

akiFQC marked this pull request as ready for review August 9, 2024 06:30

lsz05 reviewed Aug 9, 2024

View reviewed changes

src/jmteb/embedders/data_parallel_sbert_embedder.py Show resolved Hide resolved

akiFQC added 2 commits August 9, 2024 16:41

update

79a6c8b

del unused import

56f415d

lsz05 approved these changes Aug 9, 2024

View reviewed changes

lsz05 reviewed Aug 9, 2024

View reviewed changes

akiFQC merged commit ca71155 into dev Aug 13, 2024
3 checks passed

lsz05 mentioned this pull request Aug 19, 2024

[dev to main] v1.3.0 #55

Merged

1 task

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Improve: batch size setting and multi GPU inference with SentenceTransformers+DP #53

Improve: batch size setting and multi GPU inference with SentenceTransformers+DP #53

akiFQC commented Aug 8, 2024 •

edited

Loading

lsz05 Aug 9, 2024

lsz05 Aug 9, 2024

lsz05 commented Aug 9, 2024

akiFQC commented Aug 9, 2024

lsz05 left a comment

lsz05 Aug 9, 2024

	class TestSentenceBertEmbedder:
	class TestDPSentenceBertEmbedder:

Improve: batch size setting and multi GPU inference with SentenceTransformers+DP #53

Improve: batch size setting and multi GPU inference with SentenceTransformers+DP #53

Conversation

akiFQC commented Aug 8, 2024 • edited Loading

関連する Issue / PR

PR をマージした後の挙動の変化

挙動の変更を達成するために行ったこと

動作確認

lsz05 Aug 9, 2024

Choose a reason for hiding this comment

lsz05 Aug 9, 2024

Choose a reason for hiding this comment

lsz05 commented Aug 9, 2024

akiFQC commented Aug 9, 2024

lsz05 left a comment

Choose a reason for hiding this comment

lsz05 Aug 9, 2024

Choose a reason for hiding this comment

akiFQC commented Aug 8, 2024 •

edited

Loading