06장 데이터 타입
데이터 타입(data type)
데이터 타입이란 값의 종류를 의미한다. 자바스크립트의 모든 값은 데이터 타입을 갖는다. 자바스크립트 (ES6)는 7개의 데이터 타입을 제공한다. 7개의 데이터 타입은 원시타입(primitive type)과 객체타입( object/reference type)으로 분류할 수 있다.
구분 | 데이터 타입 | 설명 |
---|---|---|
원시 타입 | 숫자(number) 타입 | 숫자, 정수와 실수 구분 없이 하나의 숫자 타입만 존재 |
원시 타입 | 문자열(string) 타입 | 문자열 |
원시 타입 | 불리언(boolean) 타입 | 논리적 참(true)과 거짓(false) |
원시 타입 | undefined 타입 | var 키워드로 선언된 변수에 암묵적으로 할당되는 값 |
원시 타입 | null 타입 | 값이 없다는 것을 의도적으로 명시할 때 사용하는 값 |
원시 타입 | 심벌(symbol) 타입 | ES6에서 추가된 7번째 타입 |
객체 타입 | - | 객체, 함수, 배열 등 |
6.1 숫자(number) 타입
C나 자바의 경우 정수와 실수(소수점 이하가 있는 숫자)를 구분해 int, long, float, double등 다양한 숫자 타입을 제공한다. 하지만 자바스크립트는 독특하게 하나의 숫자 타입만 존재한다.
ECMAScript 사양에 따르면 숫자 타입의 값은 부동소수점 형식을 따른다. 즉, 모든 수를 실수로 처리하며, 정수만 표현하기 위한 데이터 타입(Integer type)이 별도로 존재하지 않는다.
정수, 실수, 2진수, 8진수, 16진수 리터럴은 모두 동일한 숫자 타입으로 처리되며, 메모리에는 2진수로 저장된다. 따로 2진수, 8진수, 16진수로 표현하기 위한 타입을 제공하지 않아 이들의 값을 참조하면 모두 10진수로 해석된다.
자바스크립트의 숫자타입은 정수만을 위한 타입은 없고 모든 수를 실수로 처리한다.
숫자 타입은 추가적으로 세 가지 특별한 값도 표현할 수 있다.
Infinity : 양의 무한대
-Infinity : 음의 무한대
NaN : 산술 연산 불가(not-a-number)
자바스크립트는 대소문자를 구별(case-sensitive)하므로 NaN을 NAN, Nan, nan과 같이 표현하면 에러가 발생한다. 자바스크립트 엔진은 NAN, Nan, nan을 값이 아닌 식별자로 해석한다.
6.2 문자열(string) 타입
문자열은 0개 이상의 16비트 유니코드 문자(UTF-16) 의 집합으로 전세계 대부분의 문자를 표현할 수 있다. 문자열은 작은따옴표( ’ ’ ), 큰따옴표( “ ” ) 또는 백틱( )으로 텍스트를 감싼다. 가장 일반적인 표기법은 작은 따옴표를 사용하는 것이다.
따옴표로 감싸는 이유는 따옴표로 감싸지 않으면 식별자 같은 토큰으로 인식하기 때문이다.
6.3 템플릿 리터럴
ES6부터 템플릿 리터럴(template literal)이라는 문자열 표기법이 도입되었다. 템플릿 리터럴은 일반 문자열과 비슷해 보이지만 작은따옴표( ‘ ‘ ) 또는 큰따옴표 ( “ “ ) 같은 일반적인 따옴표 대신 백틱 ( ‘ ‘ )을 사용해 표현한다.
6.3.1 멀티라인 문자열
일반 문자열 내에서 줄바꿈(개행)이 허용되지 않는다.
따라서 일반 문자열 내에서 줄바꿈 등의 공백(white space)을 표현하려면 백슬레시(\)로 시작하는 이스케이플 시퀀스 (Escape sequence)를 사용해야한다.
표2) 다양한 이스케이프 시퀀스의 종류들
이스케이프 시퀀스 | 의미 |
---|---|
\0 | Null |
\b | 백스페이스 |
\f | 폼 피드 : 프린터로 출력할 경우 다음 페이지의 시작 지점으로 이동한다. |
\n | 개행(LF, Line Feed): 다음 행으로 이동 |
\r | 개행(CR., Carriage Return): 커서를 처음으로 이동 |
\t | 탭(수평) |
\v | 탭(수직) |
\uXXXX | 유니코드. 예를 들어 ‘\u0041’ 은 ‘A’, ‘\uD55C’는 ‘한’ 이다. |
\’ | 작은 따옴표 |
\” | 큰따옴표 |
\ | 백슬래시 |
줄바꿈과 들여쓰기가 적용된 HTML 문자열은 다음과 같이 Escape Sequence를 사용해 작성한다.
일반 문자열과 달리 Template literal 내에선 Escape Sequence를 사용하지 않고도 줄바꿈이 허용, 모든 공백도 있는 그대로 적용된다.
6.3.2 표현식 삽입
문자열은 문자열 연산자 + 를 사용해 연결할 수 있다. + 연산자는 피산자중 하나 이상이 문자열 인경우 문자열 연결 연산자로 동작, 그 외에는 덧셈 연산자로 동작한다.
템플릿 리터럴 내에서 표현식 삽입(expression interpolation)을 통해 간단히 문자열을 삽입할 수 있다. 이를 통해 문자열 연산자보다 가독성이 좋고 간편하게 문자열을 조합할 수 있다.
표현식을 삽입하려면 ${ }으로 표현식을 감싼다. 평가 결과가 문자열이 아니더라도 타입이 문자열로 강제로 변환되어 삽입된다.
표현식 삽입은 반드시 템플릿 리터럴 내에서 사용해야한다. 아니면 문자열 취급을 받는다.
6.4 불리언(boolean) 타입
불리언 타입의 값은 논리적 참, 거짓을 나타내는 true와 false 뿐이다.
6.5 undefined 타입
undefined 타입의 값은 undefined가 유일하다.
var 키워드로 선언한 변수는 앞에서 보듯이 undefined로 초기화된다. 이는 선언을 안하면 쓰레기 값(garbage value)이 들어있어 undefined로 자바스크립트 엔진이 초기화를 시켜주는 것이다.
초기화를 시켜줄때 undefined로 초기화를 시켜주나요?
undefined에 원래 취지에 어긋나 혼란을 줄 수도 있다. null을 할당 해주는 것이 좋다. null을 통해 의도적으로 값이 비어있다는 것을 명시할 수 있다.
6.6 null 타입
null 타입의 값은 null 이 유일하다. 대소문자를 구분하므로 주의하자.
null은 변수에 값이 없다는 것을 의도적으로 명시 (의도적 부재. intentional absense)할 때 사용한다. 변수에 null을 할당하는 것은 변수가 이전에 참조하던 값을 더 이상 참조하지 않는 것을 의미한다.
함수가 유요한 값을 반환할 수 없는 경우 명시적으로 null을 반환하기도 한다. 예를 들어, HTML 요소를 검색해 반환하는 document.querySelector 해당 요소를 검색할 수 없는 경우 null을 반환한다.
6.7 심벌 타입
ES6에서 추가된 7번째 타입으로, 변경이 불가능한 원시 타입의 값이다. 심벌 값은 다른 값과 중복되지 않은 유일무이한 값이다. 중복이 없는 유일한 프로퍼티 키를 만들기 위해 사용한다.
다른 원시 값은 리터럴을 통해 생성할 수 있지만, 심벌은 Symbol()
함수를 호출해 생성한다 이때 생성된 심벌 값은 외부에 노출되지 않으며, 유일무이한 값이다.
6.8 객체 타입
자바스크립트의 데이터 타입은 크게 원시 타입과 객체 타입으로 분류를 한다. 그 이유는 이후 알아보고 중요한 것은 자바스크립트는 객체 기반의 언어이며, 자바스크립트를 이루고 있는 거의 모든 것이 객체라는 것이다. 지금까지 살펴본 타입 이외의 타입은 모두 객체 타입이다.
6.9 데이터 타입의 필요성
6.9.1 데이터 타입에 의한 메모리 공간의 확보와 참조
값은 메모리에 저장하고 참조할 수 있어야 한다. 당연한 말이다. 메모리에 값을 저장하려면 확보해야 할 메모리 공간의 크기를 결정해야 한다.
코드가 실행되면 컴퓨터는 숫자 값 100을 저장하기 위해 먼저 메모리 공간을 확보한다.
이후 숫자 값 100을 메모리에 2진수로 저장하려면, 값을 저장할 때 필요한 메모리 공간의 크기를 미리 알아야 한다.
자바스크립트 엔진은 데이터 타입, 즉 값의 종류에 따라 정해진 크기의 메모리 공간을 확보한다.
자바스크립트 엔진은 숫자 타입의 값을 예상하고 8바이트의 메모리 공간을 확보, 그리고 100을 2진수로 저장한다.
그림 1) 지정된 메모리 크기만큼 들어가지는 변수의 데이터
만약 8바이트로 지정하지 않는다면? (타입을 명시하지 않는다면?)
값을 찾아가는 경우에서 생각해보자. 식별자 score 를 참조해 메모리 공간으로 가 2진수로 저장되어 있는 데이터를 8바이트 단위로 읽어 들여야지 만약 메모리 공간이 표시가 되어있지 않다면 필요없는 데이터, 또는 데이터를 훼손해서 가져올 것이다.
심벌테이블
컴파일러 또는 인터프리터는 심벌 테이블이라고 부르는 자료 구조를 통해 식별자를 키로 바인딩된 값의 메모리 주소, 데이터 타입, 스코프 등을 관리한다.
6.9.2 데이터 타입에 의한 값의 해석
모든 값들은 데이터 타입을 가지며, 메모리에 2진수, 즉 비트(bit)단위로 나열된다. 메모리에 저장된 2진수는 데이터 타입에 따라 다르게 해석될 수 있다. 예를 들어 메모리에 2진수로 0100 0001로 저장이 된다면 숫자로 해석한다면 65지만 문자열로 해석하면 ‘A’이다.
이처럼 저장된 2진수를 해당 데이터 타입으로 해석해 원래 값을 찾을 수 있다.
데이터 타입이 필요한 이유는 다음과 같다.
값을 저장할 때 확보해야 하는 메모리 공간의 크기를 결정하기 위해
값을 참조할 때 한 번에 읽어 들여야 할 메모리 공간의 크기를 결정하기 위해
메모리에서 읽어 들인 2진수를 어떻게 해석할지 결정하기 위해
6.10 동적타이핑
6.10.1 동적 타입 언어와 정적 타입 언어
C나 자바같은 정적 타입(static/strong type) 언어는 변수를 선언할 때 변수에 할당할 수 있는 값의 종류, 즉 데이터 타입을 사전에 선언해야 한다. 이를 명시적 타입 선언(explictit type declaration)이라고 한다.
정적 타입 언어는 타입을 변경할 수 없으며, 선언한 타입에 맞는 값만 할당할 수 있다.
반면 자바스크립트는 정적 타입 언어와 다르게 자바스크립트에서는 변수를 선언할 때 데이터 타입을 명시하지 않는다. 단지 var
, let
, const
키워드를 사용해 변수를 선언한다.
중요한 점은 자바스크립트의 변수는 선언 시점이 아닌 할당 시점에 타입이 결정된다는 것이다. 이를 타입 추론이라고 한다. 그리고 재할당에 의해 변수의 타입은 언제든지 동적으로 변할 수 있다. 이러한 특징을 동적 타이핑 이라 한다.
또한 정적 타입 언어와 구별하기 위해 동적 타입(dynamic/weak type) 언어라 한다.
6.10.2 동적 타입 언어와 변수
동적 타입 언어는 변수에 어떤 데이터 타입의 값이라도 자유롭게 할당할 수 있다.
변수 값은 언제든지 변경될 수 있기 때문에 복잡한 프로그램에서는 변화하는 변수 값을 추적하기 어려워진다.
그리고 동적으로 변화하기에 자바스크립트 엔진에 의해 개발자의 의도와 상관없이 변화되는 경우도 있다. 개발자의 의도와 다르게 설계된 구조는 오류를 만들어 낼 걸 이다. 이는 유연성은 높지만 신뢰성은 떨어진다고 표현한다.
변수를 사용할 때 주의할 사항
변수는 꼭 필요한 경우에 한해 제한적으로 사용한다. 변수 값은 재할당에 의해 언제든지 변경될 수 있어, 동적 타입 언어인 자바스크립트가 잘못 예측해 오류가 발생할 가능성이 있다. 이에 변수가 많아지면 오류가 발생할 가능성이 높아지는 것은 당연한 것이다.
변수의 유효 범위(Scope)를 최대한 좁게 만들어 변수의 부작용을 억제해야 한다. 변수의 유효 범위가 넓으면 넓을수록 변수로 인해 오류가 발생할 확률이 높아진다.
전역변수는 최대한 사용하지 않는다. 어디서든 참조/변경이 가능해 의도치 않게 값이 변경될 가능성이 있어 다른 코드에 영향을 줄 가능성도 높다.
변수보다는 상수를 사용해 값의 변경을 억제한다.
변수 이름은 변수의 목적이나 의미를 파악할 수 있도록 네이밍한다. 이는 변수 이름뿐 아니라 모든 식별자(변수, 함수, 클래스 이름 등) 존재 이유를 파악할 수 있는 적절한 이름으로 지어야 한다.