• 검색 결과가 없습니다.

Genome sequence reconstruction

N/A
N/A
Protected

Academic year: 2022

Share "Genome sequence reconstruction"

Copied!
7
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

Genome sequence reconstruction

Lecture 13

(2)

설계 프로젝트

 Problem: Given M number of short reads of length L,

reconstruct the original sequence of length N that those shorts reads come from.

중간 보고서 제출 – 팀 구성원, 어떤 데이터를 쓸지 (어떻게 데이터를 만들지), 어떤 문제를(define your problem) 어떻게 풀껀지(간단한 아이디어)를 1장짜리 보고서로 제출. 5/23

수업시간 까지 이클래스 및 하드카피.

Construct an algorithm and implement it. 6/13(6/1 발표자), 6/15(6/8 발표자)일날 프로그램 확인.

Presentation. 6/1, 6/8일 중 택일

최종 보고서 제출- 발표시간 전까지 eclass 업로드 및 발표일에 발표전 출력물 제출

(3)

고려할 수 있는 요소들

Complications that you could consider

 N could be long (up to 3,000,000,000)

 M could be large (typically 20million~ 200 million)

 Length of L (typically 32~100)

 number of mismatches in a read, D

 There could be repeats (sequence repeats in several places)

 single-end or paired – end reads (short read 가 일정한 gap 을 두고 두개 나오는 것)

 denovo or reference?

reference genome 을 사용하지 않는 denovo sequencing 을 해도 됩니다. 이경우 장점은 새로는 species같이 reference genome이 없는 genome 을 sequencing 하거나 밝혀지지 않은 새로운 structural variation (insertion, repeats, inversion 등등) 을 찾아낼 수 있습니다.

reference genome 을 사용해도 됩니다.

 else – 그 밖에 스스로 응용가능한 문제점들을 찾아보세요.

(4)

발표방법

 발표시간은 4~5분, 질문 1분입니다. 다른 사람 발표에 적어도 두번 질문해야합니다.

 Must include the following slides

Introduction

Clearly define your problem

Explain your data (ex. where you got the data, how you generate the data, or etc.)

Input and Output

Benchmark - Other algorithm that you compared with your algorithm

Your Algorithm

Result

about your machine. (unix/mac/pc, CPU, memory size, etc)

time and space complexity in either big O notation or actual time/space

Compare with the benchmark

Future work

cons and pros of your algorithm

알고리즘 개선방안 논의

(5)

평가기준 및 some tips

평가기준

난이도 – 문제의 난이도

정확도 – 알고리즘과 그 구현이 하고자 하는 바를 정확하게 하였는지

명확도 – 누구나 알아들을 수 있게 발표가 clear 한가

질문 두번했는지 여부

보고서 점수

Tips

가능하면 남들과 다른 알고리즘을 사용하면 좋습니다. 같은 구현을 하였을 경우 상대 평가 될 수 있습니다.

빨리 발표하면 좋습니다. 비슷한 발표를 하였을 경우 첫 날 발표한 경우 점수를 더 받을 수 있습니다.

발표 일주일 전까지는 대강 완성을 한다는 생각으로 미리미리 해 놓으세요. 발표 전 몇일은 발표 연습과 보고서를 쓰는데 시간이 걸릴 것 입니다

(6)

발표시 하면 안될 것들

발표시간 엄수하세요. 5분지나면 더이상 발표할 수 없으므로 미리 5분 맞춰서 반드시 연습하고 오세요.

꼭 필요하다면 시간안걸리는 간단한 프로그램 돌려 결과를 보여주는 것은 가능하나 구현한 코드를 설명하지는 마세요.

어차피 조교랑 프로그램은 다시 검토할 것이며 코드가 아니라 보기쉽게 “알고리즘”을 설명하세요.

다른 논문 그대로 설명. 논문 review 발표가 아닙니다. 어떤 경우 그냥 논문을 copy & paste해서 알고리즘 설명하는 경우가 있었습니다.

구현 미완성 – 어려운 문제를 선택 했을 경우 구현이 잘 안될 수도 있습니다. 그래도 적어도 결과는 나와야합니다. 이유를 설명하고 어떤 때문에 성능이 원하는 만큼 안나왔다는

가능하지만 아예 결과가 도출이 안되면 안됩니다.

(7)

Let’s share ideas

 We will have 30 minutes discussion time from now

 30 mins question time

 paired end

denove

reference

use graph

참조

관련 문서

이 공정은 매일 하나의 뱃치만 작업할 수밖에 없으므로, 이상이 있는 경우 속히 조치를 취하지 않으면 막대한 경제적 피해를 본다.. 이를 관리하기 위해서

각각의 케이블 장력을 직교벡터 형태로 어떻게 나타낼 것인가?... 어떤 위치벡터의 단위벡터를 구하기

② 자연언어의 말소리는 어떻게 분류(classification)되는가. 자음과 모음은 어떻게 다른가. 자음들은 어떻게 분류되는가. 모음들은 어떻게 분류되는가. ③ 초분절음에는 어떤

z 사용 사례가 어떻게 수행되는지 어떤 메시지가 언제 보내지는지 나타낸.. z 사용 사례가 어떻게 수행되는지 어떤 메시지가

– 객체들에게 책임을 할당하고 메시지 등을 통해서 어떻게 서로 상호작용 하는지를 시퀀스 다이어그램으로 보여줌.

´ 제시된 대안들에 대해 어떤 비판도 자제하고 어떤 대안이라도 제시 하도록 장려하는 아이디어

: 욕구상태에서 행동이 어떻게 유도되고 어떤 단계를 밟아 드디어 행동이 촉발되는지에 초점을 두고 연구.. · 성취욕구는

§ 즉, 작품 안에서, 인물이 각각의 상황에 따라 어떤 반응을 하는 지 또는 어떻게 말하는 지에 따라 보여짐. 인간의 행동은