๋น ๋ฐ์ดํฐ์ ํ์ฉํ ๋ฐ์ด์ค์ธํฌ๋งคํฑ์ค + ํต๊ณ๊ธฐ์ด + ๋ฅ๋ฌ๋ ์ค์ต์ ๋ํ ์คํฐ๋์ ๋๋ค.
https://drive.google.com/drive/folders/0B6bSLTlVnagfTFJqV0dwRGdGMWs
- ํต๊ณ ๊ธฐ์ด
- ๋ฅ๋ฌ๋ ์ค์ต( tensorflow )
- ๋น ๋ฐ์ดํฐ ๊ธฐ์ด
- ๊ตฌ๊ธ genomics
- ๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์
- ์๋์ฐ์ฆ ํ๊ฒฝ์์ Jupyter์ R์ฐ๋
- Markdown ๋ฌธ๋ฒ
- Bengio ๊ต์์ ๋ฅ๋ฌ๋ ๊ฐ์ - ๋ฅ๋ฌ๋์ ๋ํ ๊น์ ํต์ฐฐ์ ์ป์ ์ ์์.
- ์ธ๊ณต์ ๊ฒฝ๋ง๊ณผ ๋ฅ๋ฌ๋-๋ฌด๋ฃ ๋์์ ๊ฐ์ ํ๊ธ
- udacity์ Deep Learning-๋ฌด๋ฃ ๋์์ ๊ฐ์ ์์ด
- Spark - ๋ฌด๋ฃ ๋์์ ๊ฐ์ ํ๊ธ
- Hadoop - ๋ฌด๋ฃ ๋์์ ๊ฐ์ ํ๊ธ
- Deepmind DQN ์ค์น
- ๋ ผ๋ฌธ : Human-level control through deep reinforcement learning
- Distributed TensorFlow
- ๋ถ์ฐ TensorFlow ์ปดํ์ผ ๋ฐ ํ ์คํธ
- ๋น ๋ฐ์ดํฐ๋ถ์-๋ฌด๋ฃ ๋์์ ๊ฐ์ ํ๊ธ
- ํ๋ก ๋ฐ Spark๋ก ๊ฐ๋ฐ๋ ๋ฐ์ด์ค์ธํฌ ๋๊ตฌ ๋ชฉ๋ก
- ํด๋ผ์ฐ๋ฐ๋ผ ๋ฐฐํฌํ์ผ๋ก ํ๋ก ์ค์นํ๊ธฐ
- ์ค์ต ์ฃผ์ : ์ ํ์ RNA์ ๋ณด๋ฅผ ํ์ฉํ ์ ์์ธก ๋ชจ๋ธ ๊ฐ๋ฐ
- ์ํ์ RNA ์ ๋ณด ํ๋๋ฐฉ๋ฒ ๋ฐ Data ๊ตฌ์กฐํ์
- ์ํ์ mRNA ๋ฐ์ดํฐ ์์ง ๋ฐ ๊ตฌ์กฐ
- ์ํ์ mRNA๋ฐ์ดํฐ๋ฅผ DB์ HBase์ ์ฌ๋ฆฌ๊ธฐ
- ์ํ์ mRNA์์ ํ์ต์ฉ, Valiaiotion์ฉ, Test์ฉ ๋ฐ์ดํฐ ๋ง๋ค๊ธฐ
- ๊ณต์ ํด๋ > ๋น ๋ฐ์ด์ค > ์ฐธ๊ณ ์๋ฃ > ํ์ต์ฉ ๋ฐ์ดํฐ
- mrna_20160125-200855_type1_00.pkl.gz ์ ๊ฐ์ ํ์ผ์ด 24๊ฐ, ์ ์ฒด ์ฉ๋ 700MB
- ์ฅ์: ํ ์ฆ ์ ์ด ์ํธ๋ ์จํ ์ฆ์ ( http://www.toz.co.kr/branch/main/index.htm?id=6 )
- ๋งค์ฃผ ํ์์ผ, ์ ๋ 7์ 30๋ถ~10์
- ์์: 2016๋ 03์ 08์ผ
- 04์ 05์ผ ๋น ๋ฐ์ด์ค:ํํธ 2 - 1ํ์ฐจ
- 03์ 29์ผ ๋น ๋ฐ์ด์ค:ํํธ 1 - 4ํ์ฐจ
- 03์ 22์ผ ๋น ๋ฐ์ด์ค:ํํธ 1 - 3ํ์ฐจ
- 03์ 15์ผ ๋น ๋ฐ์ด์ค:ํํธ 1 - 2ํ์ฐจ
- 03์ 08์ผ ๋น ๋ฐ์ด์ค:ํํธ 1 - 1ํ์ฐจ
seq. | ๋ ์ง | ๋ด์ฉ | ํ๊ธฐ |
---|---|---|---|
1 | 2016. 3. 8 | (ํต๊ณ๊ธฐ์ด) Introductory Statistics with R (Chap. 1~2)(์ด์น์ฐ) | ํ๊ธฐ |
(๋ฅ๋ฌ๋ ์ค์ต) Getting Started(๋จ๊ด์ฐ) | ํ๊ธฐ | ||
(๋น ๋ฐ์ดํฐ ๊ธฐ์ด) ์ง์ ํด๋ณด๋ ํ๋ก ํ๋ก๊ทธ๋๋ฐ : 2์ฅ(์ง์ฉ๊ธฐ) | |||
2 | 2016. 3.15 | (ํต๊ณ๊ธฐ์ด) Introductory Statistics with R (Chap. 3~4)(์ฑ๋ฏผ๊ฒฝ) | ํ๊ธฐ |
(๋ฅ๋ฌ๋ ์ค์ต) MNIST For ML Beginners์ ๋ฐํ์๋ฃ(์ ์ฌ์ฉ), MNIST For ML Beginners์ ์ฝ๋ | |||
(๋น ๋ฐ์ดํฐ ๊ธฐ์ด) ์ง์ ํด๋ณด๋ ํ๋ก ํ๋ก๊ทธ๋๋ฐ : 3์ฅ(์ฐ๋ฅญ) | |||
3 | 2016. 3.22 | (ํต๊ณ๊ธฐ์ด) Introductory Statistics with R (Chap. 5~6), ์ด๋ก ์ค๋ช (์กฐํ์ ) | |
(๋ฅ๋ฌ๋ ์ค์ต) Deep MNIST for Experts, ์ฉ์ด์ค๋ช (๋ฐํ์ง) | |||
(๋น ๋ฐ์ดํฐ ๊ธฐ์ด) ์ง์ ํด๋ณด๋ ํ๋ก ํ๋ก๊ทธ๋๋ฐ : 4์ฅ(์ด์ฌํ) | |||
4 | 2016. 3.29 | (ํต๊ณ๊ธฐ์ด) Introductory Statistics with R (Chap. 7~8)(์์น์ฐ) | ํ๊ธฐ |
(ํต๊ณ๊ธฐ์ด) 7์ฅ ์ค์ต, 8์ฅ์ค์ต | |||
(๋ฅ๋ฌ๋ ์ค์ต) TensorFlow Mechanics 101(๋ฐ์ธ์ง) | |||
(๋น ๋ฐ์ดํฐ ๊ธฐ์ด) ์ง์ ํด๋ณด๋ ํ๋ก ํ๋ก๊ทธ๋๋ฐ : 5์ฅ(๋ฐ์งํ), ์ฐธ๊ณ ์๋ฃ |
seq. | ๋ ์ง | ๋ด์ฉ | ํ๊ธฐ |
---|---|---|---|
1 | 2016.5.31 | (๊ตฌ๊ธ genomics) https://cloud.google.com/genomics/what-is-google-genomics : | |
What Is Google Genomics?, Pricing and Quotas , Getting Started (์ด์น์ฐ) | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 1์ฅ , 2์ฅ : Secondary Sort (๋ฐ์ธ์ง) | |||
2 | 2016.6.7 | (๊ตฌ๊ธ genomics) How-to Guide: Analyze Variants Using BigQuery( ์กฐ์ต์ฐ )๋ฐํ์๋ฃ | |
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 5์ฅ Order Inversion ( ๋ฐํ์ง ) | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) ํ ์คํธํ๊ฒฝ ๊ตฌ์ถ | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 6์ฅ Moving Average( ์ง์ฉ๊ธฐ ) | |||
3 | 2016. 6.14 | (๊ตฌ๊ธ genomics) How-to Guide : Installing the Cloud SDK and Genomics Commands(์ด์ฐฝ์ธ) ๋ฐํ์๋ฃ | |
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 7์ฅ Market Basket Analysis( ๋ฐ์ธ์ง) | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 8์ฅ Common Friends(์ง์ฉ๊ธฐ ) | |||
4 | 2016. 6.21 | (๊ตฌ๊ธ genomics) How-to Guide : Loading Genomic Variants (Peterpan Kim)๋ฐํ์๋ฃ | |
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 9์ฅ Recommendation Engines Using MapReduce (์ด์น์ฐ) | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 9์ฅ ๋ณด๊ฐ | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 10์ฅ Content-Based Recommendation: Movies (์ด์ฐฝ์ธ) |
seq. | ๋ ์ง | ๋ด์ฉ | ํ๊ธฐ |
---|---|---|---|
1 | 2016. 6.28 | (๊ตฌ๊ธ genomics) Broad Institute GATK on Google Genomics (๋ฐ์ธ์ง) | |
GATK ์๋ฃ1, GATK ์๋ฃ2, GATK ์๋ฃ3 | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 11์ฅ Smarter Email Marketing with the Markov Model (๋ฐํ์ง) | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 12์ฅ K-Means Clustering(์ก์์ข ) | |||
2 | 2016. 7. 5 | (๊ตฌ๊ธ genomics) Running Custom Pipelines ๋ฐํ์๋ฃ (์ด์น์ฐ) | |
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 13์ฅ k-Nearest Neighbors(์ด์ฐฝ์ธ) | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 14์ฅ Naive Bayes(์ง์ฉ๊ธฐ) | |||
3 | 2016. 7.12 | (๊ตฌ๊ธ genomics) Google Genomics Public Data | |
full list of published data์ ๋ฆฌ, 3๊ฐ์ง access๋ฐฉ๋ฒ์ ๋ํ ์์ ๋ณด์ฌ์ฃผ๊ธฐ (์์ค์) | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 15์ฅ Sentiment Analysis (์ก์์ข ) | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 16์ฅ Finding, Counting, and Listing All Triangles in Large Graphs (์ง์ฉ๊ธฐ) | |||
4 | 2016. 7.19 | (๊ตฌ๊ธ genomics)Docs ยป Process Data on Google Cloud ยป Run workflows and common tasks in parallel (์์ค์) | |
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 17์ฅ K-mer Counting (์ง์ฉ๊ธฐ) | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 18์ฅ DNA Sequencing (๊น๊ฐ๊ฒฝ) |
seq. | ๋ ์ง | ๋ด์ฉ | ํ๊ธฐ |
---|---|---|---|
1 | 2016. x.xx | (๊ตฌ๊ธ genomics)Docs ยป Process Data on Google Cloud ยป Create a Grid Engine cluster on Compute Engine | |
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 19์ฅ Cox Regression | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 20์ฅ Cochran-Armitage Test for Trend | |||
2 | 2016. x.xx | (๊ตฌ๊ธ genomics)Docs ยป Process Data on Google Cloud ยป Create a Grid Engine cluster with Preemptible VM workers | |
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 21์ฅ Allelic Frequency | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 22์ฅ The T-Test | |||
3 | 2016. x.xx | (๊ตฌ๊ธ genomics) Docs ยป Process Data on Google Cloud ยป Run SAMtools to index BAM files in Cloud Storage | |
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 23์ฅ Pearson Correlation | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 24์ฅ DNA Base Count | |||
4 | 2016. x.xx | (๊ตฌ๊ธ genomics) Docs ยป Analyze Data in Google Genomics ยป Analyze Reads | |
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 25์ฅ RNA Sequencing | |||
(๋น ๋ฐ์ดํฐ ์ ์ ์ฒด ๋ถ์) Data Algorithms: 26์ฅ Gene Aggregation |
- (๊ตฌ๊ธ genomics) http://googlegenomics.readthedocs.io/en/latest/use_cases/analyze_variants/index.html :
- Docs ยป Analyze Data in Google Genomics ยป Analyze Variants
- (๊ตฌ๊ธ genomics) http://googlegenomics.readthedocs.io/en/latest/use_cases/annotate_variants/index.html :
- Docs ยป Analyze Data in Google Genomics ยป Annotate Variants
- (๊ตฌ๊ธ genomics) http://googlegenomics.readthedocs.io/en/latest/use_cases/perform_quality_control_checks/index.html :
- Docs ยป Analyze Data in Google Genomics ยป Perform Quality Control Checks"
- (๊ตฌ๊ธ genomics) http://googlegenomics.readthedocs.io/en/latest/use_cases/linkage_disequilibrium/index.html :
- Docs ยป Analyze Data in Google Genomics ยป Compute and Analyze Linkage Disequilibrium"
- (๊ตฌ๊ธ genomics) http://googlegenomics.readthedocs.io/en/latest/sections/advanced_bigquery.html :
- Docs ยป Analyze Data in Google Genomics ยป Advanced BigQuery Topics