적외선 분광분석을 이용한 바이오 에탄올 on-line용 정량분석법 개발
김형욱⋅류준형*⋅유 준
†
부경대학교 화학공학과, *동국대학교 원자력 및 에너지공학부 (2011년 9월 2일 접수, 2011년 9월 21일 심사, 2011년 10월 26일 채택)
-
Development of On-line Quantitative Analysis for Bioethanol Using Infrared Spectroscopy
Hyeonguk Kim, Jun-Hyung Ryu*, and J. Jay Liu
†
Deparment of Chemical Engineering, Pukyong National University, Busan 606-739, Korea
*Department of Nuclear and Energy System Engineering, Dongguk University, Gyeongju 780-714, Korea (Received September 2, 2011; Revised September 21, 2011; Accepted Octorber 26, 2011)
본 논문에서는 바이오연료 제품 품질 분석의 저가격화와 시간단축, 그리고 궁극적으로 바이오연료 생산 공정의 모니 터링 실시간화를 해결하기 위해 적외선 분광분석과 화학계량학(Chemometrics)을 융합한 on-line 분광 모니터링 시스템 을 제안하고자 한다. 화학계량학 중 부분최소자승법을 사용하여 적외선 spectrum과 성분 농도 간의 정량분석을 실시하 였다. 몇 가지 전처리법과 변수 중요도척도를 이용하여 모델링한 결과 spectrum의 보정, 노이즈 감소, 검량선의 유지보 수 등의 측면에서 Savitzky-Golay 전처리가 가장 우수함을 보였다. 본 연구의 결과를 통해 실시간 품질 측정뿐만 아니 라 하나의 분광분석 장치로 여러 성분들의 동시 측정이 가능함을 확인함으로써 비용의 절감도 예상된다. 뿐만 아니라 결정계수 R 2 이 0.99 이상으로 실험실분석의 대체도 가능하다.
This paper proposes a new methodology for the real-time on-line quality monitoring of biofuel processes through the in- tegration of infrared spectroscopy and chemometrics. A method of Partial Least Squares (PLS) in Chemometrics is employed for quantitative analysis of key components in bioethanol products. After a number of preprocessing methods and variable importance in projection (VIP) are used, Savitzky-Golay method showed the best performance in terms of spectrum correction, noise reduction, and model maintenance. The proposed method allows us to economically forecast the concentration of multi- ple impurities encountered with the production of bioethanol. The proposed system is also accurate enough (R 2 > 0.99) to replace the laboratory analysis.
Keywords: bioethanol, Partial least squares, spectrum preprocessing, variable importance in projection, Infrared spectroscopy
1. 서 론
1)
화석연료를 연소시킴으로써 대량으로 배출되는 이산화탄소가 지구 온난화를 일으키는 온실가스의 주범으로 지목되면서 화석연료의 사 용에 대한 환경적, 정치적 및 사회적 논란이 거세지고 있음은 주지의 사실이다[1]. 따라서 화석연료를 대체할 수 있는 재생에너지의 도입에 대한 필요성이 강조되었고, 태양광, 풍력, 바이오매스 등 다양한 재생 에너지가 개발되고 있다. 특히 바이오매스는 재생에너지원 중에 유일 하게 액체탄소 연료를 공급할 수 있기 때문에 유망한 자원이다. 브라 질, 미국, EU 등 바이오연료 강국들은 이미 1970∼1980년대부터 바이 오연료 도입을 앞장서 왔다. 다양한 바이오매스 공정개발은 거의 완 료된 상태이며 대량생산 체계를 위한 기술개발 또한 매우 성숙된 단 계이다.
† 교신저자 (e-mail: [email protected])
반면에 한국의 경우 전반적인 재생에너지에 대하여 뚜렷한 기술적 우위성을 확보하지 못하고, 여전히 선진국과 큰 격차를 보이고 있다 [2]. 이 격차를 줄이기 위해서는 개별적인 새로운 전환공정의 개발도 필요하지만, 동시에 개발된 기술을 확장(scale-up) 시키는 대량생산 기 술개발이 동시에 이루어져야 한다. 현재까지의 바이오연료 관련 국가 규모 연구과제 현황을 살펴보면 대부분의 연구 공정개발에 국한되고 있으며 바이오연료의 대량생산 기술개발은 그 기술적 잠재력에 상응 하는 관심을 받지 못하고 있다.
바이오 연료 중 바이오 에탄올에 대해 많은 관심이 집중되고 있다.
바이오 에탄올은 당을 포함하거나 당으로 전환될 수 있는 녹말 또는
섬유소로부터 생산된다. 바이오 에탄올은 주로 옥수수 전분을 주원료
로 하여 미생물과 효소를 이용한 생물학적 공정으로 생산되고 있으며,
가솔린 대체 연료 혹은 첨가제, 연료전지의 연료로 사용되고 있다. 에
탄올은 주로 당 화합물로부터 만들어지므로 전분 이외의 탄수화물을
이용하여도 생산이 가능한데, 자연계에 가장 풍부한 물질 중의 하나
Figure 1. A typical bioethanol production process from biomass.
Property Limit Method
Ethanol, volume %, min 92.1 D5501
Methanol, volume %, max 0.5 D5501
Solvent-washed gum content,
mg/100 mL, max 5.0 D381
Water, volume %, max 1.0 E203 or E1064 Ignorganic Chloride,
mass ppm (mg/L), max 10 D7319 or D7328
Copper, mg/kg, max 0.1 D1688
Acidity (as acetic acid CH 3 COOH),
mass % (mg/L), max 0.007 D1613
pH 6.5 to 9.0 D6423
Sulfur, mass ppm, max 30. D2622, D3120, D5453 or D7039
Total sulfate, mass ppm, max 4 D7318, D7319 or D7328
Benzene, vol% max 0.06 D5580
Olefins, vol% max 0.5 D6550
Aromatics, vol% max 1.7 D5580
Table 1. Specification of Bioethanol Given by ASTM D4806-10[3]
인 셀룰로오스가 대표적인 예이다. 일반적인 바이오매스로부터 에탄 올의 생물학적 전환공정은 Figure 1에 나타내었다.
Figure 1 에서 알 수 있듯이 바이오 에탄올 생산 공정은 주로 중⋅소 규모의 회분식 전환 공정으로 이루어져 있다. 회분식 공정은 연속식 공정과는 달리 강한 비선형성을 가지기 때문에, 비선형적인 조업 상 황 변경을 예방하기 위한 제어와 모니터링, 및 EPD (end-point deter- mination) 같은 관련 기술의 중요성이 더 강조된다. 또한 회분식 공정 의 복잡성과 고난도의 실행 작업 순서 같은 다루기에 어려운 여러 가 지 특성들 때문에 대량생산 기술의 개발에 많은 노력이 필요하다. 그 러나 무엇보다도 중요한 문제는, 앞서 서술한 여러 난제들을 극복하 고 대량생산 기술을 개발하여도 공정의 중간 또는 최종제품의 품질을 실시간으로 모니터링 기술이 확보되지 못한다면, 대량생산 기술 적용 을 통한 안정적인 제품 생산은 불가능하다는 점이다. 따라서 바이오 연료 생산 공정의 실시간 품질 측정 기술 개발이 아주 시급함을 알 수 있다.
바이오연료에 미량 포함되어 있는 불순물의 정량측정은 바이오연 료의 대량생산 체계를 위한 제조공정의 최적화와 최종 제품의 품질을 확보하는데 있어 매우 중요하다. ASTM D4806-10 (미국)과 같은 바이 오 에탄올의 생산과 품질관리를 위한 표준이 제시되는 것도 이와 같 은 이유 때문이다. 하지만 wet chemistry를 포함한 전통적인 실험실 분석법으로 바이오매스 원료의 성분 또는 최종 제품의 불순물을 분석 하려면 최소 4시간에서 최대 1일 이상이 소요되며, 여러 종류의 분석 장비와 많은 인력이 필요하므로 산업 현장에서 이러한 체계를 적용하 는 것은 바람직하지 않다. 그러므로 본 논문에서는 적외선 분광학과 화학계량학(Chemometrics)에 기반을 둔 분석기술을 개발하여 바이오 연료 품질 분석 시간 및 비용 단축을 유도하여, 바이오연료 생산 공정 의 모니터링 실시간화를 해결하는 방법론을 제안한다.
1.1. 실시간 정량 분석 시스템
앞서 언급한 바와 같이, 바이오연료 생산 공정에 공장단위의 제어 및 최적화와 같은 대량생산 기술의 적용을 위해서는 바이오연료 제품 의 품질 분석의 저가격화 및 시간단축이 선결되어야 할 문제이다. 최 종 생산물인 바이오연료에 미량 포함되어 있는 불순물의 정량측정 은 바이오연료의 대량생산 체계를 위한 제조공정의 최적화와 최종 제품의 품질을 확보하는데 있어 매우 중요한데 미국의 경우 ASTM D4806-10 에 바이오 에탄올의 생산과 품질관리를 위한 규격을 제시하 였다[3](Table 1 참조).
바이오 에탄올의 경우 전체 제조 공정이 최적으로 운전되지 않았을 때 벤젠(benzene), 올레핀(olefin), 물, 메탄올 등의 불순물이 소량 생성 되는데, 이러한 불순물은 내연기관의 성능과 수명 그리고 배기가스 내 유해물질 등의 문제와 깊은 관련이 있다. 이러한 이유로 위와 같은
ASTM 표준에 주요 불순물로 분류되어 있고 이에 대한 다양한 분석 방법 또한 제시하고 있지만, 기존의 분석 방법들에는 많은 한계점이 존재한다.
우선 에탄올과 메탄올 및 벤젠의 분석방법인 GC (gas chromatogra- phy) 측정법은 시료의 전처리가 필요한 경우가 있으며, 칼럼과 분석 시료 물성에 따라 측정 소요 시간이 다르다. 휘발성 및 낮은 열안정성 과 같은 문제가 있고, 시료가 기화함으로써 재사용이 불가능하다. 다 음으로 올레핀 계열의 분석방법인 초임계유체크로마토그래피(SFC)는 체류시간, 선택도, 이론단수, 분리도 의존 온도, 압력, 밀도, 선속도, 이 동상 조성 등의 많은 설정 변수들이 있어 설정 시간이 오래 걸리고 매우 복잡하다. 끝으로 수분측정 방법인 Karl Fisher법은 일반적으로 모든 시료의 수분 측정에 사용되지만 기기 조작에 있어 숙련자가 아 니면 오차가 크고, 분석 시 시료가 파괴된다는 단점이 있으며, 종종 재현성이 좋지 않은 경우가 발생하는 것으로 알려져 있다[4].
이와 같은 전통적인 분석화학에 의존한 불순물 정량 분석방법은 개 별 분석 장비와 시약을 필요로 하고, 이의 운영 및 유지 보수에도 많 은 물질적, 인적 자원이 요구된다. 또한 이와 같은 방법들을 사용할 때 분석시간이 오래 걸리므로, 정량 분석결과에 근거하여 엔지니어가 항상 생산 공정을 최적상태로 적당한 시점에 조정하여 운전하는 것은 불가능하다. 따라서 대량생산 측정 시스템은 분석시간이 짧아야 하고 생산 및 검사 비용을 최소로 하며 시료 처리가 간편해야 한다. 또한 검량모델의 정확도가 뛰어나 안정적인 공정 운영과 체계적인 품질관 리에 도움을 줄 수 있어야 한다. 따라서 대량생산 기술을 사용하여 바 이오연료의 생산 공정을 항상 최적의 상태로 유지하기 위해서는 산업 환경에 적합한 저렴하고 정확한, 그리고 빠른 최종제품 품질 측정기 술이 요구되며 이러한 이유로 실시간 분광분석 시스템의 도입이 불가 피하다.
분석화학 기법 중 본 논문에서 선택한 적외선 분광법은 반복⋅재
현성이 우수하고 기기가 매우 안정적이므로 검량 모델(calibration
model) 만 완벽하게 만들면 오랜 기간 사용이 가능하다. 또한 기기의
유지 보수가 크게 필요치 않아 안정적이며 오랜 기간 동안 사용이 가
Figure 2. Electromagnetic spectrum.
능하고 여러 성분(multicomponent)의 동시 측정이 가능하다. 그리고 GC, SFC 등의 기존 분석 장비가 비교적 고가인데 비해 비교적 간단 한 장비인 적외선 분광계를 사용하며 실시간, 비파괴 분석 또한 가능 하다.
하지만 바이오 에탄올 생산에 있어 중간에 발생하는 불순물은 여러 가지가 있기 때문에 각 화합물 고유의 적외선 spectrum 간에 중첩이 생겨 데이터가 복잡하고 분석이 어려워 MLR (multiple linear regression) 과 같은 방법으로는 분석이 힘들다. 반면에 화학계량학 중 대표적인 다변량 회귀법인 부분최소자승법(partial least squres, PLS) 은 복잡한 적외선 spectrum을 가지고도 여러 혼합물 형태의 시료를 분 석할 수 있고, 여러 파장과 조성/물성간의 상관관계를 통해 검량하기 위한 최적의 방법이다.
본 연구에서는 이상의 상황을 종합하여, 바이오연료 제품 품질 분석 의 저가격화와 시간단축 및 바이오연료 생산 공정의 모니터링 실시간 화를 해결하기 위해 적외선 분광분석법과 화학계량학(Chemometrics) 을 융합한 실시간 분광 모니터링 시스템을 개발하고자 한다.
1.2. 적외선 분광학 (IR, Infrared spectroscopy)
복사선의 흡수 또는 방출 시 수반되는 광자의 에너지는 물질을 구 성하는 원자나 분자의 에너지 준위간의 간격이나 분자의 운동진동수 와 연관성이 있다. 이러한 전자기 복사선은 Figure 2에서 볼 수 있듯 이 파장(wavelength)에 따라 라디오파(radio wave)에서부터 마이크로 파(micro wave), 적외선(infrared, IR), 가시광(visible, VIS), 자외선 (ultraviolet, UV), X 선(x-ray) 등의 순서로 높아지며, 각각의 파장에 따 라 물질이 대응하는 에너지 형태가 다르다. 적외선은 근적외선(near infrared, NIR), 중적외선(mid infrared : MIR), 원적외선(far infrared, FIR)으로 다시 세분할 수 있다.
적외선 영역의 spectrum은 약 12800∼10 cm -1 범위의 파수(wave- number) 를 갖는 복사선을 망라한다. 중적외선 분광법은 정성 및 정량 분석에 널리 응용되고 있으며 광학이성질체를 제외하고는 대부분의 경우 다른 화합물로부터 쉽게 구별할 수 있는 독특한 지문을 제공한 다. 적외선은 가시광선에서처럼 전자 전이를 일으킬 정도로 충분히 큰 에너지를 갖지 못하지만 분자의 진동이나 회전운동으로 에너지의 변화를 일으킨다. 모든 분자화학종은 적외선으로 인한 여러 가지 진 동과 회전상태 사이에 작은 에너지 차를 존재하게 하며 이러한 에너 지차이는 독특한 적외선 흡수 spectrum의 특징을 제공하여 특정화합 물의 정성 및 정량에 효과적으로 활용된다.
분자에서 원자의 상대적 위치는 정확히 고정되어 있지 않고 여러 가지 종류의 진동크기에 따라 연속적으로 요동하고 있다. 진동은 신 축(stretching)과 굽힘(bending)의 기본 범주로 구분된다. 신축진동은 두 원자 사이의 결합축을 따라 원자간 거리가 연속적으로 변화함을 말한다. 굽힘진동은 두 결합 사이의 각도 변화를 말하며, 네 가지 종 류가 있다. 즉, 가위질진동(scissoring), 좌우흔듬진동(rocking), 앞뒤흔 듬진동(wagging) 및 꼬임진동(twisting)이다. 액체와 고체에서는 분자 의 회전이 크게 제한되어 불연속적인 진동선 및 회전선들은 안 보이
고, 분자간의 충돌과 상호작용 때문에 넓게 펴진 봉우리들이 나타난 다. 이러한 적외선 고유 흡수는 분석하고자 하는 유기물의 고유한 지 문영역으로 작용하여 특정 제품의 일치성 분석에 활용할 수 있다[5].
1.3. 화학계량학 (Chemometrics)
중적외선 분광학(Mid-IR spectroscopy)에서는 4000∼400 cm -1 의 파 장을 갖는 적외선을 시료에 조사하여 흡수 spectrum을 측정하는데, 이 대역은 주로 분자들의 기본 밴드가 나타나는 영역으로 각 분자의 특 정한 흡수밴드가 비교적 깨끗하게 분리되어 있어 특정 화합물의 존재 유무를 확인하는데 쓰여 왔다. 그러나 일반적으로 시료에는 한 가지 화합물만이 존재하는 것이 아니고 여러 가지 화합물이 섞여 있는 경 우가 많다. 특히 관심 있는 분자의 spectrum이 혼합물을 구성하는 다 른 성분의 spectrum과 겹치게 되는 경우에는 화합물의 유무를 확인하 기가 매우 어렵게 된다.
이와 같이 여러 가지 화학물이 섞여있는 경우에 나타나는 복잡한 적외선 spectrum을 분석하기 위해서 예측력이 우수하고 잡음 등에 강 건한 성능을 가진 검량 모델을 개발하는 것이 화학계량학(Chemome- trics) 의 핵심이며, 신속하고 정확한 화학적⋅물리적 성분의 예측을 가 능하게 해주는 중요한 역할을 수행한다. 화학계량학은 패턴인식이나 다변량 통계 등에서 많이 사용되는 방법으로 중첩이 심한 적외선 spectrum에서도 원하는 조성 및 물성의 검량이 가능한 회귀법을 제공 한다. 입력 변수의 수가 너무 많고 그들 간 상관관계가 심하여 기존의 일반 회귀분석으로는 회귀식을 구하기 어려울 때, 우리가 알고 있는 출력변수를 이용해 입력변수와 통계적인 상관관계를 만드는 방법이 다. 이는 실험적인 검량기법으로 이 연구의 분광분석에서 입력변수는 샘플의 spectrum에 해당되며 출력변수는 샘플의 조성에 해당된다. 이 때 주로 사용되는 화학계량학 기법에는 다중선형회귀법(MLR), 부분 최소자승법(PLS) 등이 있다[6].
1.3.1. 다중선형회귀법 (Multiple Linear Regression)
여러 개의 입력 변수(X)와 출력 변수(Y)를 한꺼번에 분석할 수 있 는 장점을 가진 다중선형회귀법(MLR)은 입출력 변수가 각각 한 개씩 인 다변량 데이터에 적용하는 최소 자승법(least square method)을 입 출력 변수가 각각 여러 개의 다변수 데이터에 적용할 수 있도록 확장 한 방법이다.
m 번의 실험으로 얻어진 입출력 변수들의 값을 출력 변수 데이터 블 록(행렬 Y) 및 입력 변수 데이터 블록(행렬 X)으로 표시하면 다음의 행렬 방정식과 같다.
(1)
여기서 B(n×p)는 입력 변수의 행렬 X(m×n) 및 응답 변수의 행렬 Y(m×p) 사이의 선형 관계식을 나타내는 계수로 이루어진 행렬이며, E는 오차로 이루어진 (m×p) 행렬이다. 행렬 B는 최소 자승법을 통해 다음과 같은 행렬 연산으로 구할 수 있다.
(2)
(2) 로 구해진 행렬 B를 이용하면 MLR 모델을 만드는데 이용되었
거나 이용되지 않은 입력 변수 값에 대한 출력 변수의 예측 값을 계산
할 수 있다. MLR은 다른 다변량 통계 분석법과 달리 사용하기가 간
편하고 변수들이 갖고 있는 의미를 이해하기 쉬운 장점을 갖고 있으
X T Y P, W C
*
T T
= +
= +
= X TP E Y TC F T XW
Figure 3. Indirect modeling by PLS.
나 다음과 같은 단점들을 가지고 있다. 우선 입력 변수들의 실험값들 이 상호관계가 선형적으로 독립적이지 못할 경우 즉, 입력변수 행렬 X 의 열들이 서로 선형 관계가 독립적이지 못할 때, (2)에 사용되는 행 렬 X T X 가 전 랭크를 가지지 못하여 역행렬을 가질 수 없으므로 계수 행렬 B를 구할 수 없다는 점이다. 또한 선형 관계가 독립적이라도 선 형 상관관계가 매우 크면 입출력 변수 값이 조금만 변해도 계수 행렬 B값의 변화가 너무 커져서 신뢰도가 떨어진다는 단점이 있다. 또한 입력 변수의 개수와 샘플 수가 비슷하거나 차이가 나지 않으면 행렬 B의 신뢰도가 떨어지므로 결과적으로 예측 성능이 나빠지는 단점이 있다[7].
1.3.2. 부분최소자승법 (Partial Least Squares)
부분최소자승법은 다수의 입력 변수(행렬 X)와 다수의 응답 변수 ( 행렬 Y) 사이의 관계를 모델링하는 투영법이다. 두 행렬은 다음과 같 이 나뉜다.
≅ (3)
≅ (4)
T와 U는 각각 입력변수와 출력변수의 score 행렬, P와 C는 각각 입 력변수와 출력변수의 loading 행렬이다. 잠재변수(latent variable)의 개 수는 주로 cross validation을 이용하여 결정한다. x-scores t a 는 X 행렬 (a = 1 일 때) 또는 X의 잔차 행렬(a > 1일 때)의 선형 조합(linear com- binations) 이 된다.
(5)
w a 는 a번째 잠재변수의 가중치 벡터이다. T와 U 사이의 공분산이 최대가 되도록 둘 사이의 내적관계를 성립한다.
≅ (6)
결과적으로 PLS 예측모델을 다음과 같이 나타낼 수 있다[8]. Figure 3에 PLS의 개념을 도식적으로 나타내었다.
≅ (7)
PLS 모델이 만들어지면 변수중요도척도(variable importance in pro- jection, VIP)를 이용하여 어떤 X 변수가 Y를 모델링하는데 중요한지 알아볼 수 있다. VIP는 개별독립변수 X k 가 잠재변수 t a 들에 기여한 정 도를 나타내는 척도로써, Y의 총변동 중 t a 에 설명된 변동에 가중치를 곱하여 계산한다.
, (8)
w ka 는 a번째 잠재변수에서 k번째 독립변수가 갖는 비중이며 일반적 으로 독립변수가 1.0보다 큰 VIP값을 가지면 Y를 설명하는데 보다 더 유의한 변수로 간주할 수 있다. 이를 이용하여 VIP값이 1보다 큰 영역 의 흡광도만을 입력변수로 선택하여 사용하면, 전체 파장 구간을 사
용하는 경우와 비교했을 때 적은 PLS 인자수를 가지고도 예측 정확도 를 향상시킬 수 있다[9].
1.4. Spectrum 전처리
Spectrum 전처리(preprocessing)는 광학 측정상의 노이즈를 제거하 고 그 영향에 따른 오차를 줄이는 중요한 방법으로서 보다 안정적인 광학 spectrum을 구하는 데 사용된다. 또한 전처리된 spectrum을 사용 하면 보다 안정적이고 정확도가 높은 예측 모델을 만들 수 있는데 전 처리 방법에는 일반적으로 MSC (multiplicative scattering correction), SNV (standard normal variate), OSC (orthogonal signal correction), Savitzky-Golay법 등이 있다[10].
1.4.1. Multiplicative Scatter Correction (MSC)
산란현상은 파장에 따라 일정하지 않아서 바탕선이 이동하거나, 바 탕선의 기울기가 변화하고, 그리고 심할 경우 바탕선이 곡선 형태로 도 나타날 수 있다. 이를 보완하기 위해 MSC를 이용하여 평균 spec- trum 을 계산한 후 이를 이상적인 spectrum으로 간주하고 보정한다. 회 귀분석을 이용하여 기울기와 절편을 구하여 각 spectrum의 파장별 흡 광도들과 평균 spectrum 흡광도와의 상관관계를 구한다. 따라서 평균 spectrum 은 다음과 같이 구할 수 있다.
(9)
여기서, 는 (m×n) spectrum 행렬 X의 원소이며 는 평균 spectrum (1×n) 이다. m과 n은 각각 샘플 수와 파장 수이다. 이 평균 spectrum 을 이용하여 각 파장에서의 흡광도 데이터에 대해 다음과 같 이 선형회귀를 취한다.
(10)
선형회귀를 하여 구한 기울기 및 절편 값을 이용하여 다음 식 과 같이 MSC 보정을 한다.
(11)
여기서, 는 보정된 샘플 i의 spectrum이다.
MSC 방법의 제약조건에 대해서는 spectrum 변화와 농도간의 선형
관계가 존재할 때만 사용할 수 있다는 점과 시료들이 화학적으로 유사
할 경우에 만족할만한 결과를 얻을 수 있다는 점이 알려져 있다[10].
Figure 4. Raw IR spectrum of standard samples.
1.4.2. Standard Normal Variate (SNV)
SNV 역시 MSC와 마찬가지로 광산란 보정을 위한 방법이지만 다 른 수학적인 방법을 사용한다. SNV는 각 spectrum을 샘플 spectrum의 평균과 표준편차로 정규화하여 광산란의 영향을 제거하는 방법이며 이상적인 spectrum이 필요하지 않다. SNV에 의해 광경로나 광원의 변 동에 따른 spectrum의 변화 등이 보정될 수 있으며, SNV로 보정된 spectrum은 무차원이 된다[10].
, (12)
여기서, 와 는 샘플 i의 모든 파장에서의 흡광도 평균과 표준편 차이다.
1.4.3. Orthogonal Signal Correction (OSC)
일반적으로 전처리는 농도 정보와 상관이 없는 구조적인 변이를 제 거하기 위하여 한다. spectrum에서 구조적인 노이즈를 제거함과 동시 에 PLS 모델링을 할 경우, spectrum의 분산이 큰 부분만 강조하게 되 어 성분과 관련된 정보도 함께 제거될 수 있다. PLS는 원래의 spec- trum에서 상관이 매우 높은 spectrum 성분만을 찾는 방법으로 계산되 는 x-score t a 를 성분 y와 직교시켜 이를 이용하여 성분에 직교하는 spectrum 성분을 계산하여 spectrum x에서 성분 y과 상관없는 변수만 제거하면 성분과 관계가 높은 spectrum 성분만 남긴다. 즉, PCA의 기 본식 및 PLS의 NIPALS 알고리즘(3)에서 spectrum x와 성분 y가 서로 직교하기 위해서는 T와 Y의 내적이 0( ∙ ∙ )이 되면 직교하게 된다. 즉, 이다. 따라서, 이 를 이용하여 성분 Y와 상관이 없는 spectrum성분( × , OSC 인자)을 계산할 수 있다. 이를 원 spectrum에서 제거하면 상관이 높은 spec- trum 성분을 얻을 수 있다. × , OSC 인자 수는 성분과 직교하는 spectrum 성분( × ) 을 몇 번 제거할 것인가를 나타낸다 [10].
1.4.4. Savitzky-Golay (SG)
분광기(spectrometer)에서 발생되는 노이즈를 감소시키는 방법인 Savitzky-Golay 방법에 의한 신호 평활법은 다음과 같은 식을 따른다.
(13)
식에서 은 잡음이 제거된 i 번째 측정값, Y j 는 를 구하기 위해 서 사용된 잡음을 제거하기 전의 측정값들을 의미하며, c j 는 Savitzky- Golay 의 방법의 적용에 있어서 잡음의 제거를 위해 기준이 되었던 함 수관계와 최소자승의 원리에 따라 구해진 컨볼루션(convolution) 정수 이다[11]. 식에서 N은 일종의 scaling 상수이다.
위 식에서 이동 창의 크기 n은 1 이상의 값을 가지며 Savitzky-Golay 방법에서 사용되는 이동 창의 크기는 2n+1이 된다. 이는 어느 한 측정 값의 잡음 신호를 제거하기 위하여 측정값과 함께 전후 측정된 일정 수의 측정값들을 참조하여 계산을 수행하는 것을 의미한다[11].
2. 실 험
본 실험에서 IR 기기는 Varian 660-IR을 사용하였다. 이 기기의 광 원은 high intensity ceramic light source, 검출계는 DLATGS를 사용하 였고, beam splitter로 Ge/KBr을 사용하였다. 바이오 에탄올 혼합물 샘 플을 측정하기 위해 ATR (attenuated total reflectance)을 사용했다. 기 존의 IR은 직접 샘플을 통해 적외선 beam을 투과하여 고체, 액체 및 가스를 분석하는 데 반해 ATR은 샘플의 반사율을 사용한다. 감소된 총 반사율은 beam이 샘플에 접촉할 때, 내부로 투영된 적외선 Beam 이 발생하는 변화를 측정한다. 적외선 beam이 광학적으로 짙은 크리 스탈(diamond, zinc selenide 또는 germanium) 뒤에 샘플에서 나오는 순간적인 파장을 만든다. 이러한 경로를 거쳐 검출기에 도달하면 검 출기에서 흡수된 빛이 산출되어 spectrum으로 나타난다. 측정 옵션은 파장범위를 4000∼500 cm -1 로 하고 resolution을 4.0 cm -1 로 놓고 1번 측정에 0.9 s가 소요되며 48번 측정하여 이것을 평균하여 한 개의 spectrum 으로 나타내도록 설정하였다. 이 때 1개의 샘플당 약 45 s의 측정시간이 소요되었다. spectrum의 수집과 베이스 라인 수정 등은 Varian 의 FT-IR Resolution Pro 프로그램을 이용하였다.
측정에 사용될 바이오 에탄올 혼합물 표준 샘플은 시약 급의 물질 을 사용하여 표준샘플을 제조하였다. 이때 사용된 시약은 99.8% (v/v) 메탄올, 99.9% (v/v) 에탄올, 99.9% (v/v) 벤젠, 그리고 초순수 증류수 를 사용하였으며, 올레핀 계열의 불순물로는 98.0% (v/v) 1-Decene을 사용하였다. 바이오 에탄올 혼합물 성분 예측을 위한 검량모델 개발 및 평가를 위해서 실험계획법(design of experiment) 중 혼합물 설계를 이용하여 혼합물의 성분비를 결정하였다. 이때 5개 물질의 부피비(%) 의 상한과 하한을 ASTM D4806에 근거하여 설정 하였다. 총 47개의 sample 의 혼합물의 성분 함량이 결정되었고 이에 따라 47가지의 샘플 을 제조하였다. 실제 성분비는 에탄올이 81∼92%, 나머지 불순물의 성분비는 약 1∼5%이었다.
3. 결과 및 고찰
47 개의 표준 샘플의 분광분석 spectrum 전체를 Figure 4에 겹쳐 나 타내었다. 바탕선 보정에도 불구하고 그림과 같이 연속 측정에 따른 여러 가지 기기 영향으로 인해 spectrum의 바탕선의 이동이 관찰되며 따라서 보정이 필요한 것으로 판단된다. 앞에서 제시한 4가지의 전처 리 방법으로 spectrum 보정을 수행하였고 우선 각각의 전처리의 결과 의 효과적인 정성적 비교를 위하여 spectrum 값을 1∼100의 값으로 스케일링하여 그 결과를 Figures 5∼8에 나타내었다.
그림의 그래프에서 확대한 2000∼2500 cm -1 영역에서의 정보는
Table 2 에서 명시되어 있는 자료에서 보았을 때 에탄올의 작용기와는
관계가 없기 때문에 이 영역에서 각각의 전처리에 따른 바탕선 보정
Figure 5. IR Spectrum corrected by MSC.
Figure 6. IR Spectrum corrected by SNV.
Figure 7. IR Spectrum corrected by OSC.
Figure 8. IR spectrum preprocessed by Savitzky-Golay method.
Functional groups Band position (cm -1 ) Intensity C-H (Alkyl group) 2850 ∼2960 Medium to strong
〓C-C C 〓C
3020 ∼3100 1650 ∼1670
Medium Medium
≡C-H C ≡C
3300 2100 ∼2260
Strong Medium C-Cl
C-Br C-I
600 ∼800 500 ∼600
500
Strong Strong Strong O-H
C-O
3400 ∼3640 1050 ∼1150
Strong, broad Strong
Aromatic ring 1600, 1500 Strong
N-H C-N
3310 ∼3500 1030, 1230
Medium Medium
C 〓O 1670 ∼1780 Strong
O-H(Carboxylic acid) 2500 ∼3100 Strong, very broad
C ≡N 2210 ∼2260 Medium
Table 2. Infrared Absorption Regions Based on Functional Groups
Component The number of latent variables in PLS models Raw SNV MSC OSC Savitzky Golay
All component 24 26 24 23 16
Ethanol 16 16 14 15 6
Methanol 15 17 15 17 7
Water 15 17 15 11 6
Olefin 16 16 15 16 7
Benzene 15 16 15 17 6
Table 3. Regression Results in Terms of the Number of Latent Vari- ables in PLS Models
효과를 육안으로도 파악하기 쉽다. 그림의 그래프에서 알 수 있듯이 MSC 나 SNV 보정을 한 경우, raw spectrum과 비교 시 spectrum 형태 가 유사함을 알 수 있으며 바탕선의 보정도 어느 정도 이루어진 것을 알 수 있다. 전처리 결과로만 보았을 경우에도 이 영역에서는 흡광도 변화의 범위가 좁아지므로 바이오 에탄올의 성분 결정을 위한 peak로 보기보다는 여러 노이즈에 대한 peak로 해석할 수 있으며, OSC의 경 우에는 상대적으로 각 파장에서의 spectrum이 강조되어 바이오 에탄 올의 성분 결정을 위한 peak 영역 뿐만 아니라 각 실험의 불필요한 노이즈 영역 즉, 확대영역 또한 두드러져 바탕선 보정이 효과적으로 되지 않음을 확인할 수 있었다. 하지만 Savitzky-Golay 전처리의 경우 1차 미분, 이동창의 크기 11, 그리고, 3차 회귀분석을 조건으로 써서 적용하였을 때 성분 결정에 필요한 spectrum이 강조되는 반면, 바탕선
이동 및 노이즈 성분에 대한 영역들은 전처리 결과 사라짐을 보였다.
여러 물질로 이루어진 혼합물의 경우 IR spectrum이 매우 복잡해서 각 성분의 특정 peak를 선택할 수 없기 때문에 PLS 법을 이용하여 각 각 전처리한 spectrum의 검량모델을 만들고 전처리 효과를 분석하였 다. 일반적으로 검량 모델의 성능측정은 결정계수 R 2 의 값을 가지고 가늠한다. ASTM 등의 표준에서는 그 값이 0.990보다 같거나 클 것을 권장하므로 R 2 값이 0.990 이상일 경우 PLS의 잠재변수 수를 이용하 여 전처리 효과를 분석하였다.
PLS 법은 Umetrics의 Simca-P v.8.0을 사용하여 계산을 수행하였으 며 1756개의 파장에서의 흡광도를 x변수로, 5개의 혼합비를 y변수로 각각 사용하였다. 상관이 높은 spectrum data 즉, VIP값이 높은 일부 구간을 측정함으로써 측정비용을 줄이는 동시에 예측 정확도를 보장 할 수 있기 때문에 1,765개의 데이터 중 VIP값이 1 이상인 746개의 spectrum 을 이용하여 검량식 모델링을 하였다. 각 전처리 방법의 성능 을 정성적으로 비교하기 위하여 검량식 모델링의 결과를 Table 3에 정리하였다.
Table 3과 같이 SNV, MSC, OSC 전처리 방법은 raw spectrum과 PLS 잠재변수 수의 변화가 거의 없거나 늘어나는 것을 볼 수 있는데 이는 불완전한 바탕선 보정 또는 노이즈의 증폭 영향으로 인한 것으 로 보인다. 그에 비해 Savitzky-Golay 전처리는 PLS 잠재변수 수를 최 소로 할 수 있는 효과적인 방법으로 보인다.
Table 4 에서 보듯이 주성분인 에탄올은 물론, 메탄올, 물, 올레핀 그
Component R 2 value
Raw SNV MSC OSC Savitzky Golay All component 0.991 0.992 0.993 0.992 0.991 Ethanol 0.994 0.990 0.993 0.994 0.991 Methanol 0.991 0.990 0.991 0.992 0.991 Water 0.995 0.990 0.993 0.990 0.991 Olefin 0.992 0.991 0.993 0.990 0.992 Benzene 0.993 0.995 0.997 0.991 0.995 Table 4. Regression Results in Terms of R 2 Values
Figure 9. Calibration plot for ethanol of Standard samples.
Figure 10. Calibration plot for impurities of Standard samples.
리고 벤젠 등 바이오 에탄올 제조공정에서 발생하는 주요 불순물의 경우에도 PLS 검량 모델은 정확한 농도 예측 값을 제공할 수 있음을 알 수 있다. 하지만 실제 연속 및 회분식 공정인 바이오 에탄올 공정 에서 실시간 측정용으로 사용할 경우에는, Savitzky-Golay 전처리법을 이용하여 만든 PLS 모델을 제외한 다른 모델들은 많은 수의 PLS 잠 재변수가 필요하게 된다. 이럴 경우에 검량선을 모델링할 때는 물론, 공정의 상태 변화로 PLS 모델을 갱신할 필요가 있을 경우에도 상당한 노력이 필요하다. 이러한 관점에서 볼 때, 장기간의 실시간 측정용으 로 사용될 경우에 Savitzky-Golay 전처리법을 이용하여 만든 PLS 모 델이 더 선호된다고 할 수 있다.
이 모델을 사용하여 얻은 상관계수 R 2 의 값이 0.99 이상이므로 모든
성분에 대해 최종 제품의 품질관리를 위한 실험실 분석도 대체할 정 도의 정확도를 보여주고 있다. 개별 성분별 모델을 이용하여 Figure 9 와 Figure 10에 각 성분별 농도 % (v/v)의 실제 값 대비 예측 값의 그 래프를 나타내었다.
4. 결 론
본 논문에서 적외선 분광분석법과 화학계량학을 이용하여 설계한 분석 시스템은 바이오 에탄올의 주성분인 에탄올의 농도는 물론, 제 조공정 중 발생할 수 있는 여러 불순물들의 농도 또한 정확히 예측이 가능함을 보였다. 또한 spectrum 데이터를 이용한 데이터 전처리의 효 과 및 최적 전처리 방법을 규명하였다. Savitzky-golay 전처리 방법을 이용한 spectrum으로 검량 모델링을 할 경우 모델 안정성이 향상되고 효과적인 공정관리가 가능함을 보였다.
본 연구를 기반으로 설계한 분광분석을 이용한 바이오연료 실시간 모니터링 시스템은 ASTM 등의 표준에서 제시하는 기존의 분석화학 방법 보다 빠르고, 정확하게 측정이 가능하기 때문에 측정값에 따라 제조공정 중 조업조건 등을 바꾸어 공정을 항상 최적의 상태로 운전 이 가능하게 할 수 있다. 또한 광섬유 probe 등을 사용하면 분광기가 원거리에 있어도 on-line으로 운영이 가능하기 때문에 예측값을 직접 피드백 제어에 사용하여 실시간 조업조건의 변경이 가능해진다. 그리 고 한 가지 분석 장비로 하나의 성분만을 측정할 수 있는 기존의 분석 방법과는 달리, 하나의 분석 시스템으로 여러 성분을 동시에 측정이 가능하기 때문에 분석에 관련된 제반 비용의 절감도 가능하다는 장점 이 있다.
감 사
이 논문은 농림수산식품부의 지원과 2010년도 정부(교육과학기술 부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업 (2010-0003056) 이며, 이에 감사드립니다.
참 고 문 헌