해상도별 정리

July 25, 2006 at 2:11 am (Multimedia)

QQQVGA 80×60

QQVGA 160×120

QVGA 320×240

QCIF 176×144

CIF 352×288

VGA 640×480

SVGA 800×600

XGA 1024×768

SXGA 1280×1024

VXGA 1600×1200

Permalink Leave a Comment

CIF (Common Intermediate Format)

July 25, 2006 at 2:07 am (Multimedia)

CIF (Common Intermediate Format)

CIF는 화상회의 시스템에서 사용되는 비디오 형식으로서, NTSC와 PAL 방식의 신호 모두를 쉽게 지원한다. CIF는 초당 30 프레임의 데이터 속도를 조건으로 지정하는데, 각 프레임은 352 픽셀로 구성된 288개의 라인을 담고 있다. 이와 관련되는 표준으로서, QCIF (Quarter CIF)는 CIF에 비해 약 1/4 정도의 데이터 량을 전송하며, 전화회선을 이용한 화상회의 시스템에 적합하다. CIF는 QCIF와의 구분을 위해 때로 FCIF (Full CIF)라고 불리기도 한다. 아래의 차트에 있는 것은 압축되지 않은 컬러 프레임들이다.

CIF 형식                           해상도          초당 30 프레임에서의 속도 (Mbps) 
SQCIF (Sub Quarter CIF)  128 x 96         4.4 
QCIF (Quarter CIF)           176 x 144       9.1 
CIF (Full CIF, FCIF)           352 x 288       36.5 
4CIF (4 x CIF)                 704 x 576       146.0 
16CIF (16 x CIF)             1408 x 1152    583.9 

Permalink Leave a Comment

QVGA(Quarter-VGA)

July 25, 2006 at 2:04 am (Multimedia)

QVGA(Quarter-VGA)

An image size of 320 x 240 pixels. This can refer to the size/resolution of a display, an image (file), or a camera.

QVGA is a common size for high-resolution phone displays, and also for video captured by some high-end phones.

Higher resolution offers more detail. QVGA is larger (higher resolution) than QCIF, but smaller than VGA.

VGA is 640 x 480 pixels. QVGA is therefore one-quarter the area, hence the name Quarter-VGA (QVGA).

Permalink Leave a Comment

G.723.1

July 25, 2006 at 1:06 am (Multimedia)

http://computing-dictionary.thefreedictionary.com/G.723.1

 An ITU standard for speech codecs optimized for modems. It uses the LD-CELP method and provides toll quality audio at 5.3 or 6.4 Kbps. The higher rate requires less processing power. It also provides a mode where one person speaks at a time and uses the extra bandwidth for the talking party.

Permalink Leave a Comment

vocoder

July 25, 2006 at 1:02 am (Multimedia)

보코더란 Voice Coder의 약자로 디지털로 바뀐 음성신호인 PCM 신호를 압축하는기술입니다. 이것은 기존의 압축과는 방법이 좀 다른데 그것은 음성을 만들수있는 주요 파라메터를 생성하여 그것을 전송한다는 것 입니다. 따라서 기존의 압축률과는 비교가되지않을정도로 압축률이 높읍니다. 따라서 보코더에서 출력되는 데이터의 속도는 8Kbps가 일반적입니다.

그럼 이러한 파라메터들의 추출은 어떻게 할까요?
그것은 사람의 발성기관을 즉 음성을 만들어내는 기관 예를들면 성대등을 선형필터로 모델링을하고 이 모델링한 필터의 최적의 출력을 결정하기 위한 파라메터를 찾읍니다.
일반적으로 이러한 필터는 포먼트(Formant)필터와 피치(Pitch)필터를 구현하고 이것의 파라메터를 찾는 것입니다. 포먼트 필터는 LPC(Liner predictive Coder)필터라고도하는데 이것은 사람의 음성이 성대에서 생성된 소리가 공명될때(?) 발생되며, 따라서 각종 공명강(구강, 비강 …)등을 모델링한 것입니다. 포먼트 필터는 또 다른 전문용어로 파형의 Envelope에 해당되는 주파수입니다.

피치 필터는 2가지단계로 걸러지는데 첫째가 피치필터라는 것이고, 둘째가 고정피치필터 혹은 코드북이라고하는 것입니다. 이것은 음성의 근원이되는 성대를모델링한것이고, 그러므로 이것은 성대에서 생성되는 피치(이것은 펄스열로 생각됨)를 구하는것입니다.

다소 전문적인단어들의사용으로 이해가 어려울지 모르겠으나, 정리하면 기존의 음성압축은 음성소스에서 생성된 PCM 데이터 자체를 압축하지만 보코더는 PCM데이터에서 음성의 각종성분들을 분석하여 분석된 파라메터 데이터를 전송하는것입니다. 그래서 보코더의 처리 과정에는 “분석-합성”이라는 처리가 반복됩니다.

예를들어서 친구에게 노트를 빌려주기로 했는데 노트를직접내가 가져다줄수도있지만 그 친구에게 노트가 들어있는 사물함열쇠를 줄수도있겠죠. 그러나 노트가 많다면 사물함열쇠를 주는 것이 노트를 직접주는것보다는 훨씬 힘이 덜드는것과 같은 맥락입니다
(출처 : ‘보코더 ?’ – 네이버 지식iN)
———————————————————————————————————————

보이스 코더(voice coder)의 약어이다. 음성파형부호화 기술이 파형자체에 대한 정보를 전송하는 데 비해 보코더는 음성신호에 내재된 특성을 이용, 모델화하여 이 모델의 각종 매개변수들을 전송하고 수신측에서는 수신된 매개변수들을 이용하여 다시 음성신호를 복원하는 방식이다. 4~10 Kbps의 데이터율로 동작하는 보코더는 16~64 Kbps 파형부호화보다는 약간의 음질저하가 있지만 10 Kbps 이하 낮은 대역폭에서는 파형부호화보다 좋은 성능을 가진다. 반면에 보코더가 사람의 음성생성체계의 모델을 이용하고 있으므로 음악이나 음성이 아닌 다른 신호는 정확하게 재생하지 못하고 신호처리 지연이나 전력소비가 크다는 단점이 있다.

현재 상용되거나 표준 규격화된 보코더의 종류로는 2.4 Kbps/4.8 Kbps IMBE(Improved Multi Band Excitation), 4.8 Kbps~8 Kbps DoD-CELP(Department of Defense Code Excited Linear Prediction), 8 Kbps VSELP(Vector Sum Excited Linear Prediction), 8 Kbps QCELP(Qualcomm CELP), 16 Kbps LD-CELP(Low Delay CELP) 등이 있다.

보코더는 음성을 압축하여 디지탈화하는 것을 뜻합니다.
CDMA는 디지탈 통신 방식의 일종으로 디지탈 통신의 경우 사람의 음성을 그대로 전송하지 않고 압축하여 전송하는데 이것은 주파수를 효율적으로 사용하기 위해서 입니다. 통상 사람의 음성은 4KHz까지의 대역을 가진다고 보는데 샘플링 과정을 거치게 되면 8khz 신호로 바뀌게 되고 PCM 신호로 바꾸기 위해 8bit 코딩하여 최종 64kbps 신호가 됩니다. CDMA에서는 이 64kbps 신호를 그대로 전송하지 않고 다시 압축하여 8k 또는 13k 신호로 만듭니다.
64kbps 신호를 그대로 전송하면 음성 품질이 좋겠지만 가용 채널수가 줄어들어 효율적이지 못하며 8k로 압축할 경우 채널수는 많아지지만 음성은 품질이 떨어지죠. 당연히 13k 보코더는 압축을 8k 보코더 보다 덜하니까 음성 품질은 좋고 채널수는 작습니다.
한국의 경우 셀룰라사업자인 SK텔레콤과 신세기통신은 8K 또는 8K EVRC 보코더를 사용하고 나머지 PCS 사업자는 모두 13k 보코더를 사용합니다. 8k EVRC는 음질은 13k 보코더 수준이면서 채널수는 많은, 보다 개선된 보코딩 방식입니다.

위의 내용은 사실 이해하기 어려우실수도 있습니다.
이제 본론으로 들어가죠.

미국의 경우 13k 보코더만 사용한다고 말씀하셨는데 이는 잘못알고 계신 사항입니다. 미국의 CDMA 사업자가 반드시 13k 보코딩 방식으로 서비스하지는 않고 8k 보코딩 방식으로 서비스하는 사업자도 있습니다.(셀룰라 사업자는 8K, PCS 사업자는 13k를 사용하고 있습니다.)
하지만 중국의 경우 상용화된 CDMA 서비스는 모두 8k 보코딩 방식을 사용합니다.(일부 시범망에서 13k 보코더 사용이 시도된 적은 있습니다.) 따라서 중국에 수출하실 경우 8k 또는 8k EVRC 단말기를 수출해야 합니다.

8k와 13k 보코더는 기지국과 기지국 제어기의 소프트웨어를 변경하지 않는한 동시 사용이 불가능합니다. 이유는 위에서 말씀드린대로 압축하는 방식 자체가 다르기 때문입니다.

저에게 중고 단말기 수출건을 문의해 오시는 경우가 많은데 중국에 한국의 신형 또는 중고 단말기를 수출하실 경우 아래 사항에 유의하시기 바랍니다.

1. 보코딩 방식은 맞는가?(PCS 단말기는 중국으로 수출해도 소용없음)
2. 주파수 대역은 동일한가?(사업자별로 할당받은 주파수 대역이 다르므로 유의해야 하는데 주파수 대역이 다를경우 단말기의 주파수 필터를 교체하면 사용이 가능합니다.)
3. 단말기가 중문을 지원하는가?(단말기의 메뉴나 단문 메세지 서비스가 한글 또는 영문만 지원한다면 중국에서 그리 환영받지 못하겠죠.)
4. 단말기 등록이 가능한가?(현재 중국의 상용 CDMA 사업자는 China Greatwall Telecom인데 여기서 단말기를 등록해 줘야만 사용이 가능)
5. 기타(전원등)

디지탈 이동통신 시스템에서는 아날로그 음성 신호를 디지탈 신호로 바꾸기 위해 PCM과 보코더를 사용합니다. PCM은 일반 유선전화에서 주로 사용하는 것으로 사람의 음성신호를 64kbps의 데이타 전송율로 바꿉니다. 사람의 음성을 최대 4KHz라고 보았을때 샘플링 과정을 거치면서 나이퀴스트의 샘플링 이론에 따라 8KHz로 변환되고 다시 8bit로 코딩되어 64Kbps 신호로 바뀌게 되는 것이지요.

보코더는 PCM에서 만들어진 64kbps의 데이타에서 목소리의 특징만을 뽑아내어 8.6kbps, 4kbps, 2kbps, 0.8kbps의 4가지 데이타 전송율 중에서 선택적으로 변환합니다. 말의 속도가 빠를때는 8.6k의 데이타 전송율로 변환을 시키고 말이 느릴때는 4k의 데이타 전송율로 변환시킨다는 의미입니다.

보코더에서 나온 데이타는 에러 정정을 위해 콘볼루션 인코더로 입력됩니다. 콘볼루션 코드는 한비트를 출력하기 위해서 이전에 출력된 여러 비트를 연관 시킴으로서 에러를 정정하며 콘볼루션 인코더를 거친 데이타는 심볼로 변환됩니다.

콘볼루션 코드화된 심볼은 심볼반복기를 통하여 여러번의 반복과정을 통하여 모두 19.2ksps로 통일되어 출력됩니다.

콘볼루션 코드화된 데이타는 블럭인터리브로 입력되어 버스트에러를 랜덤 에러화하게 됩니다.

이제 남은 과정은 CDMA 과정에서 핵심적인 PN Spreading 과정입니다. 블럭 인터리빙된 데이타는 PN 시퀀스로 된 Long Code에 의해 암호화 되는데 Long Code의 경우 그 가지수가 2exp(42)-1에 달합니다. 이렇게 암호화된 데이타에는 다시 타사용자에 의한 간섭을 줄이기 위한 전력제어용 비트가 삽입됩니다.

위에서 보시면 아시겠지만 블럭 인터리버를 거칠때 까지 데이타의 전송율은 19.2ksps이며 Long Code는 데이타의 길이는 바꾸지 않고 값만 바꾸는 역할을 하므로 Long Code가 입혀지더라도 데이타 전송율은 여전히 19.2k입니다. 이제 채널 구분을 위하여 64bit의 왈시 코드가 Exclusive OR되어 대역이 1.2288MHz로 확산됩니다.
이렇게 대역확산된 신호는 전송시에 잡음이나 간섭의 영향을 받게 됩니다.

이제 수신단에서는 이렇게 대역 확산된 신호에서 원신호를 추출해야 하는데 송신시 곱해진 왈시코드와 동일한 신호를 곱하여 광대역 신호를 협대역화 합니다. 이때 잡음이나 간섭 신호는 왈시코드에 의해 확산이 되어 버리고 원신호만이 추출됩니다. CDMA가 간섭이나 잡음에 강하다는 것은 바로 이런 이유 때문입니다.

이상의 과정을 이해하기 어려우시면 아래의 자료를 참고하시기 바랍니다.

대역 확산 통신 방식이 잡음에 강한 이유…
http://www.pcs016.co.kr/freemancity/cdma/cdma002.html

CDMA의 채널 코딩 과정
http://www.pcs016.co.kr/freemancity/cdma/cdma010.html

Walsh 코드와 PN 코드
http://www.pcs016.co.kr/freemancity/cdma/cdma011.html

음성부호화 방식에는 파형 부호화 방식과 보코딩 방식이 있습니다. 이중 보코딩 방식으로는 음성 신호의 생성 모델에 근거하여 음성 신호로부터 특성 파라미터를 추출하고 복호화기에서 이 특성 파라미터를 이용하여 음성을 재생하는 방식입니다.
보코딩 방식은 신호의 파형을 정밀하게 재생하는 것이 아니라 사람의 귀로 들을때 최대한 원해 신호와 차이가 없도록 소리를 재생합니다.

파형 부호화 방식과 보코딩 방식의 장점을 결합한 방식으로 혼성 부호화 방식이 있는데 이는 보코딩 방식으로 분석을 하여 음성의 특성을 제거하고 특성이 제거된 오차 신호를 파형 부호화 방식으로 전송하는 방식입니다. 따라서 8Kbps 정도의 저전송율에서도 우수한 음질을 유지합니다.

혼성 부호화 방식으로는 오차 신호의 모델링 방식에 따라 RELP, MPLPC, CELP, VSELP, RPE-LTP, IMBE 등이 있습니다.
CELP(Code Excited Linear Prediction) 방식은 보코딩 방식으로 음성을 분석하여 음성의 특징을 제거한 후 그 오차 신호를 Stochastic Coder로 전송하는 방식으로 합성에 의한 해석 Analysis by Synthesis 방식을 사용합니다. 따라서 비교적 낮은 전송률에서도 우수한 음질을 내는 반면 복잡한 계산량을 요구합니다.

EVRC(Enhanced Variable Rate Coder)는 셀룰러폰 서비스에 사용되는 음성 부호화 방식으로 기존의 셀룰러망을 그대로 사용하되 사람의 음성을 디지털로 변화, 압축하는 알고리즘(보코더:Vocoder)을 개선해 통화 음질을 개인휴대통신(PCS) 수준으로 높인 것입니다.
EVRC는 잡음 제거 기능이 뛰어나고 음성을 부호화할때 고난이도의 S/W 가공 과정을 통하여 전송함으로써 자연음에 가까운 최적의 음질을 구현합니다. EVRC 방식은 단말기의 배터리 소모량을 줄일 수 있는 이점이 있고, 잡음이 심한 지역내에서 통화하는 경우 사람의 음성을 제외한 잡음을 최소화 함으로써 음질을 크게 개선할 수 있으며 PCS QCELP(13Kbps)방식보다 용량면에서 30~40% 우수합니다.
(출처 : ‘보코더 ?’ – 네이버 지식iN)

Permalink Leave a Comment