(87) 대수(代數), 함수, 그리고 국어
검색 엔진은 빠른 시간 내에 검색 결과를 보여 주기 위해 웹 페이지들의 데이터를 수집하여 인덱스를 미리 작성해 놓는다. 인덱스란 단어를 알파벳순으로 정리한 목록으로, 여기에는 각 단어가 등장하는 웹 페이지와 단어의 빈도수 등이 저장된다.(중략)

사용자가 검색어를 입력하면 검색 엔진은 인덱스에서 검색어에 적합한 웹 페이지를 찾는다. ㉡적합도는 단어의 빈도, 단어가 포함된 웹 페이지의 수, 웹 페이지의 글자 수를 반영한 식을 통해 값이 정해진다.

해당 검색어가 많이 나올수록, 그 검색어를 포함하는 다른 웹 페이지의 수가 적을수록, 현재 웹 페이지의 글자 수가 전체 웹 페이지의 평균 글자 수에 비해 적을수록 적합도가 높아진다. 검색 엔진은 중요도와 적합도, 기타 항목들을 적절한 비율로 합산하여 화면에 나열되는 웹 페이지의 순서를 결정한다.

15. … ㉡을 고려하여 검색 결과에서 웹 페이지의 순위를 높이기 위한 방안으로 가장 적절한 것은?

⑤ 다른 웹 페이지에서 흔히 다루지 않는 주제를 간략하게 설명하되 주제와 관련된 단어를 자주 사용하여 ㉡을 높인다.

-2023학년도 9월 평가원 모의고사-
인덱스…각 단어가 등장하는 웹 페이지와 단어의 빈도수 등
[신철수 쌤의 국어 지문 읽기] 자신이 알고 있던 개념 적용은 신중히
인덱스는 옆의 ‘찾아보기’처럼 책 내용 중에서 중요한 단어나 항목, 인명 따위를 쉽게 찾아볼 수 있도록 일정한 순서에 따라 별도로 배열해 놓은 목록으로, 색인(索引)이라고도 한다. 지문에서도 ‘각 단어가 등장하는 웹 페이지와 단어의 빈도수 등’을 저장한 것이 인덱스라 했다. ‘빈도수’는 통계에서 기본 개념으로, 같은 현상이나 일이 반복되는 도수(度數: 거듭하는 횟수)다. 한 번이라도 나타난 항목의 빈도수는 1이고, 위 사진에 있는 책의 경우 <라블레와 그의 세계>는 3, 랑그는 6이다.

평소 인덱스를 봐온 학생이라면 글 읽기에 도움이 됐을지도 모른다. 그런데 이 항목의 빈도수는 지문 속 ‘단어의 빈도수’와는 다르고, 차라리 ‘각 단어가 등장하는 웹 페이지’의 수와 같다. ‘아는 것이 병이다’라는 말이 있다. 혹시 자신이 알고 있는 인덱스의 개념을 적용해 지문을 읽은 학생이라면 이 점을 조심해야 한다. 적합도는 단어의 빈도, 단어가 포함된 웹 페이지의 수, 웹 페이지의 글자 수를 반영한 식을 통해 값이 정해진다.‘식(式)’이란 숫자, 문자, 기호를 써서 이들 사이의 수학적 관계를 나타낸 것으로, 수학의 가장 대표적 분야인 대수(代數)에서 다뤄진다 했다. 이는 이미 중학교 때까지 모든 학생이 배우는 것이므로, 이에 대해 이해하고 글 읽기에 적용할 수 있어야 한다.

지문에는 ‘적합도’라는 개념을 수학적으로 정의하고 있다. 따라서 적합도를 구하는 식을 떠올리며 읽어야 할 것이나 그러지 못해도 학생의 잘못이 아니다. 왜냐하면 지문에 ‘적합도는 단어의 빈도, 단어가 포함된 웹 페이지의 수, 웹 페이지의 글자 수를 반영한 식을 통해 값이 정해진다’고만 했지, 적합도가 여러 요소와 어떤 관계가 있는지는 구체적으로 말하지 않았기 때문이다. 앞에서 철수 쌤이 글을 읽을 때 식을 떠올리며 읽어야 한다고 했지만, 구체적으로 그렇게 할 수 없는 문장도 있다는 것도 말해 두고 싶다. 해당 검색어가 많이 나올수록, 그 검색어를 포함하는 다른 웹 페이지의 수가 적을수록, 현재 웹 페이지의 글자 수가 전체 웹 페이지의 평균 글자 수에 비해 적을수록 적합도가 높아진다.‘Aㄹ수록 B’는 A가 독립 변수, B가 종속 변수인 함수를 말하는 것이라 했다. 따라서 지문 내용은 (정)비례 또는 반비례를 의식하며 다음과 같이 정리할 수 있다.
[신철수 쌤의 국어 지문 읽기] 자신이 알고 있던 개념 적용은 신중히
‘검색어가 많이 나’온다는 것은 검색어의 빈도수를 말한다. 그리고 ‘다른 웹 페이지’라는 말을 고려해 ‘현재 웹 페이지’라는 말도 생각할 수 있어야 한다. 나아가 현재 웹 페이지의 검색어 빈도수가 있고, 다른 웹 페이지들 각각의 검색어 빈도수가 있다는 것도 생각할 줄 알아야 한다. 한편 ‘현재 웹 페이지의 글자 수가 전체 웹 페이지의 평균 글자 수의 비해 적’다는 것에서 ‘검색어’와 ‘글자’가 다른 개념임을 알고, ‘전체 웹 페이지’라는 개념이 무엇인지를 생각해 ‘전체 웹 페이지=현재 웹 페이지+다른 웹 페이지’를 떠올려야 하며, 전체 웹 페이지 중에 현재 웹 페이지의 글자 수가 매우 적은 편에 속한다는 것을 생각해내야 한다.
[신철수 쌤의 국어 지문 읽기] 자신이 알고 있던 개념 적용은 신중히
이를 바탕으로 옆의 사례를 이해할 수 있어야 한다. 검색어 a를 포함하고 있는 전체 웹 페이지는 A, B, C이고, b를 포함하고 있는 전체 웹 페이지는 A, C이다. A, B, C의 평균 글자 수는 a의 경우 200이고 b의 경우는 250이며, a의 경우 웹 페이지 B가, b의 경우 웹 페이지 A가 글자 수가 적다. 한편 웹 페이지 A, B, C에서 a의 상대도수는 1/10, 1/5, 1/30이고, b의 상대도수는 웹 페이지 A, C에서 각각 1/20, 1/30이다. 상대도수는 중학교 때 이미 배운 수학적 개념이라 웹 페이지 글자 수와 검색어 빈도수의 개념을 연결해서 떠올린 것인데, 이 정도는 고등학생이라면 할 수 있어야 하는 국어 능력이다. 이에 따르면 a를 검색했을 때 B, A, C 순서로, b를 검색했을 때 A, C 순서로 적합하다. 결국 문제의 ⑤에서 ‘흔히 다루지 않는’다는 것은 전체 웹 페이지 수가 적다는 것이고, ‘간략하’다는 것은 글자 수가 적다는 것이다. 나아가 ‘주제와 관련된 단어를 자주 사용’한다는 것은 검색어의 상대도수를 높인다는 것이다. 포인트
성보고 교사
성보고 교사
1. 자신이 알고 있는 인덱스의 개념을 적용해 지문을 읽을 경우 차이가 있을 수 있음을 유의해야 한다.

2. 대수 개념은 이미 중학교 때까지 모든 학생이 배우는 것이므로, 이에 대해 이해하고 글 읽기에 적용할 수 있어야 한다.

3. 글을 읽을 때 식을 떠올리며 읽어야 하지만, 문장 내용 자체가 구체적으로 그렇게 할 수 없는 것이 있다.

4. ‘Aㄹ수록 B’는 A가 독립 변수, B가 종속 변수인 함수를 말한다.

5. 지문에 있는 개념들의 관계를 파악해 직접 언급되지 않은 개념을 추리할 수 있어야 한다.