자바스크립트로 프로그래밍 입문 5. 비트(Bit), 바이트(Byte) 그리고 자료형(Data Type)

비트(Bit)와 바이트(Byte)

앞서 컴퓨터의 연산장치는 2진수 체계로 연산한다고 설명했었습니다. 이때 2진수의 0 혹은 1 하나의 수를 비트(Bit)라고 하고 8개의 비트를 모은 것, 즉 8자리의 2진값을 바이트(Byte)라고 합니다.

컴퓨터는 바이트를 최소 단위로 하여 2진수를 처리(전송, 연산, 저장 및 호출)합니다.

예를 들어 숫자 3은 2진수로 나타내면 11, 즉 2자리 수(2비트)이지만 실제로 컴퓨터 내에서는 최소 1바이트, 즉 8자리 2진값 00000011로 간주됩니다.

다양한 자료(데이터)의 표현

1바이트에는 0부터 255(00000000부터 11111111)까지 2의 8승 개의 값을 저장할 수 있습니다. 255보다 큰 수를 저장하고 싶다면? 바이트의 수를 늘리면 됩니다. 2바이트는 16비트이므로 2의 16승 개의, 즉 0부터 65,535까지의 수를 나타낼 수 있습니다.

음수는 어떻게 나타낼까요? 음수는 2의 보수로 표현합니다. 이 부분은 조금 어려울 수도 있는데, 반드시 암기해야 하거나 기억해야 하는 부분은 아닙니다. 그냥 이러한 방법이 있구나 정도로만 보고 넘어가도 됩니다.

2의 보수를 구하는 방법은 각 비트의 0을 1로, 1을 0으로 바꾼 후 1을 더해주면 됩니다.

예를들어 00000001의 2의 보수를 구하는 방법은 아래와 같습니다.

1) 0을 1로, 1을 0으로 바꿈.. : 11111110
2) 1을 더해줌............... : 11111111

이런 이상한 방식으로 표현하는 이유는 컴퓨터가 연산을 쉽게 하기 위해서입니다. 이 방식으로 음수를 표현하면 음수와 음수, 혹은 음수와 양수 간의 덧셈뺄셈을 간편하게 할 수 있습니다.

(-1) + (-1) 은 11111111(8비트) + 11111111(8비트) 으로 표현할 수 있고 이것을 그냥 2진수로 간주하여 값을 더하면 111111110(9비트)가 됩니다. 한자리가 늘어났죠. 현재 1바이트(8비트)를 기준으로 연산을 하고 있으므로 이 늘어난 가장 앞자리 비트를 무시해버리면 11111110(8자리)가 되고 이 값은 -2를 나타내는 값이 됩니다.

이 방식을 사용하면 첫번째 자리의 값은 양수인 경우 언제나 0, 음수인 경우 언제나 1이 되는 특징이 있습니다.

문자의 경우 문자와 숫자 사이 변환 값을 약속해 놓고 문자를 수로써 저장하고 읽어옵니다. ASCII(아스키) 테이블을 예로 들어 살펴봅시다.

ASCII 테이블은 0부터 127까지 수를 사용해 영문 대소문자와 문장부호, 몇몇 특수 문자를 가지고 있습니다.


a를 ASCII로 저장하면 위 테이블에 따라 숫자 97에 해당하는 1바이트 2진수 01100001가 저장됩니다. 위 테이블에 없는 문자나 기호(한글및 외래어나 특수문자)를 저장하려면 ASCII가 아닌 다른 방식을 통해서 문자를 2진수로 변경하여 저장할 수 있습니다. 대표적으로 Unicode 방식이 있죠.

지금까지 우리는 양수, 음수 그리고 문자를 컴퓨터가 어떻게 2진법으로 표현하는 지를 배웠는데요, 컴퓨터는 01100001이 ASCII로 a를 나타내는지 숫자 97을 나타내는지, 11111111이 양수 127을 나타내는지 음수 -1을 나타내는지, 0000001 0000001이 2바이트로 저장된 257인지 아니면 1바이트로 저장된 1과 또다른 1을 나타내는지 어떻게 구별 할 수 있을까요?

이를 알려 주는 것이 자료형입니다.

자료형

자료형(Data Type 혹은 Type)이란 컴퓨터에 저장된 2진수를 어떻게 해석해야 하는지를 표시하는 방법입니다. 자료형보다는 타입이라는 말로 더많이 씁니다. 자료형에 따라 컴퓨터는 어떠한 데이터가 몇 바이트 짜리인지, 문자인지 숫자인지, 숫자의 경우 첫번째 자리를 음수/양수를 표현하는 수로 해석할지 아닐지를 알 수 있습니다.

C언어의 경우 1바이트 문자를 저장하는 char 타입, 2바이트 숫자를 저장하는 short 타입, 4바이트 숫자를 저장하는 int 타입등 다양한 타입이 있습니다. 컴퓨터 성능이 좋지 않은 시절에 개발된 언어라 작은 숫자는 적은 바이트를 차지하는 타입에 담고, 큰 숫자들은 많은 바이트를 차지하는 타입에 담아 용량도 줄이고 처리 속도도 증가하는 대신, 프로그래머가 신경써야 하는 부분이 많습니다.

하지만 자바스크립트에서는, 문자및 문자열을 저장하는 타입은 string 타입 하나뿐이고, 숫자를 저장하는 타입은 number 타입 하나 뿐입니다. number 타입은 어떠한 수라도 8바이트로 처리하여 작은 수를 처리하기에 비효율적이지만 그만큼 프로그래머가 신경써야 할 부분이 줄어들었습니다. C언어가 처음 나온 시절에 비해 컴퓨터 성능이 많이 향상되어 효율성보다 편의성과 생산성을 향상시키는 쪽으로 발전한 것이지요.

프로그래밍에서는 문자와 숫자 이외에도 불리언(boolean), 배열, 객체(object)등등의 타입이 있지만 나머지는 차차 알아가도록 하고 이 강의에서는 데이터가 타입에 따라 분류된다는 것만 알아두시면 되겠습니다.

댓글

댓글쓰기

이 글에 댓글을 다시려면 SNS 계정으로 로그인하세요. 자세히 알아보기

UP