• 검색 결과가 없습니다.

벤포드의 법칙

문서에서 발/간/사 (페이지 131-135)

미국의 천문학자 사이먼 뉴컴은 년에 로그표가 담긴 책을 보면서 앞쪽 페이지가 뒤 쪽 페이지보다 더 닳아 있다는 것을 발견했다. 이는 사람들이 로그표에서 로 시작하는 값들을 더 자주 찾아봤음을 의미했다. 물리학자 프랭크 벤포드는 뉴컴의 이런 발견을

년에 공식화했다. 벤포드는 강 개의 넓이, 물리학 상수 가지, 분자 중량

가지 등 개 분야 자료들의 첫 자리 수 분포를 분석해 ‘벤포드의 법칙’을 내놓았 다. 벤포드의 법칙에 따르면 어떤 분야의 수치들에서 부터 까지의 수 이 첫 자리 수 가 될 확률은 다음과 같다.

P   log

  

이 확률은 어떻게 해서 나온 값일까?

어떤 수 의 첫째 자리의 숫자를 라고 했을 때, 부등식  ×≤    × 이 성립하고, 을 밑으로 하는 로그를 이용하면 이 부등식은

 log ≤ log   log 

이 된다. 이 부등식에서 log의 소수부분은

log  이고 log   

라 두면 다음 부등식을 만족한다.

log ≤

 log 

이때,

는 확률변수로 생각할 수 있으며 과 사이에 있다. 또한 확률변수

가 균등 하게 분포되어 있다고 가정하면

가 과 사이의 특정 구간에 있을 확률은 그 구간의 길이에 비례한다. (특히,

의 값이 과 사이에 균등하게 분포되어 있으므로 이 경우

가 과 사이의 특정 구간에 있을 확률과 그 구간의 길이는 같은 값을 갖는다.) 이로 부터 의 첫째 자리의 숫자가 가 될 확률 P 는 log ≤

 log 일 때의 확률이고 따라서

P   log  log  log

  

가 성립한다.

[그림출처] http://www.codeproject.com/Articles /215620 /Detecting-Manipulations-in-Data-with-Benford-s-Law

읽기자료

126

예시답안

풀어보기

문제 1

는 정수이므로  가 의 배수가 되기 위해서는 가 정수가 되어야 한다.

 ≤  이므로  ≤  

(ⅰ)  : 가 의 배수가 되어야 하므로     ⋯ (ⅱ)  :  이 의 배수가 되어야 하므로     ⋯ (ⅲ)  :  가 의 배수가 되어야 하므로     ⋯ (ⅳ)  :  이 의 배수가 되어야 하므로     ⋯ (ⅴ)  :  가 의 배수가 되어야 하므로     ⋯ 이것을 크기순으로 나열하면 다음과 같다.

  

 

,

 

,

 

,

 

,  ,

 

,

따라서 log   

 , log   

 이므로 log   

문제 2 log

   log       

  

  



(ⅰ)      ⋯  이면 log

 의 가수는   

 ,

(ⅱ)      ⋯  이면 log

 의 가수는   

 ,

(ⅲ)   이면 log

 의 가수는 ,

(ⅳ)  ≥ 에서는   , , , ⋯, 일 때의 가수가 반복하여 나타난다.

그러므로 집합

의 원소의 개수는 이다.

집합

의 모든 원소의 합은   

  

  ⋯  

  

127

문제 3

log    log이므로   ,   log. 따라서 주어진 부등식은

 ≤ ,  ≤ log ⋯⋯ ㉠

은 자연수이므로   또는   

ⅰ)   일 때 ㉠에서  ≤ log  ≤ log,  ≤  ≤ 

∴       

ⅱ)   일 때 ㉠에서  ≤ log  ≤ log, log ≤ log ≤ log

 ≤  ≤  ∴     ⋯ 

따라서 ⅰ), ⅱ)로부터 구하는 의 개수는     

문제 4

log    로 두면 log   log   log   log    ,   

 

log   log    

log     log   ≥ 

그런데  ≤ 를 만족해야 한다. log     는 불가능하다.

∴log    ≥ ,  ≥   log ,  ≥ log  즉, 의 첫 자리수가 이상이어야 한다.

그러므로 가능한 한 자리의 자연수    개, 두 자리 자연수   ⋯ 개

그러므로 보다 작은 의 개수는 개다.

논제Ⅰ-1

*

달러의 가치가 매년 

 씩 감소한다고 하였으므로 년 후에는 달러 대비 원화 금액은

 ×

이 되고 년 후에는 그 값이  ×

이 된다. 따라서 각각의 경우 달 러 대비 원화 금액의 상용로그값은

  log   log             

  log   log               

이고 가수는 각각 와 이다. 어떤 양수

의 첫 번째 자리의 숫자가 라는 것은

 ×(은 정수,  ≤   )의 꼴로 나타냈을 때  ≤     라는 것이므로, log

의 가수는 log  ≤ log   log  을 만족한다. 따라서 제시된 조건 log   , log   에 의하여 log       log 

* 동국대 예시답안 참조

128

이고 log     log   log 임을 알 수 있으므로 첫 번째 자리의 숫자는 각각 과  이다. 그러므로 년 후의 달러 환율의 첫 번째 자리의 숫자는 이고, 년 후의 달러 환율의 첫 번째 자리의 숫자는 이다.

논제Ⅰ-2

자료의 단위를 다른 단위로 바꾸는 것은 자료의 값에 단위환산율을 곱한다는 것이다. 여기에 상용로그를 취하면 환산율의 로그를 더해준 값이 된다. 임의의 단위환산율을 곱하여 상용로그를 취해도 가수의 분포가 변하지 않는다고 제시문 【나】를 통하여 가정하였으므로 상용로그 가수의 확률변수

는 다음을 만족한다.

P  ≤

≤   P   ≤

≤    (단,        ∈)

주어진 가정에 의하여

는 확률밀도함수 를 가진다고 하자. 제시문 【라】의 (3)에 의하여

 

    이고, 모든   ∈ 에 대하여

 

lim

→  

 

lim

→  

       

이다. 즉, 는 상수함수이다. 는 제시문 【라】의 (2)에서

 ∞   이고 

에서 정의된 함수이므로, 확률밀도함수는

   ( ≤   ) 이다.

자료의 첫 번째 자리의 숫자가 일 확률은 자료의 상용로그의 가수가 log 보다 크거나 같고 log 보다 작을 확률과 같으므로

P log  ≤

 log  

log log  log   log  ≒

이다. 그러므로 첫 번째 자리의 숫자가 가 나올 확률은 %이다.

129

문서에서 발/간/사 (페이지 131-135)

관련 문서