알고리즘 문제 풀이/항해99 코테 스터디

[99클럽/파이썬 챌린저/16일차] 비슷한 단어

제유찬 2024. 11. 13. 05:17

백준 2179번 비슷한 단어 G4

 

문제
N개의 영단어들이 주어졌을 때, 가장 비슷한 두 단어를 구해내는 프로그램을 작성하시오. 두 단어의 비슷한 정도는 두 단어의 접두사의 길이로 측정한다. 접두사란 두 단어의 앞부분에서 공통적으로 나타나는 부분문자열을 말한다. 즉, 두 단어의 앞에서부터 M개의 글자들이 같으면서 M이 최대인 경우를 구하는 것이다. "AHEHHEH", "AHAHEH"의 접두사는 "AH"가 되고, "AB", "CD"의 접두사는 ""(길이가 0)이 된다. 접두사의 길이가 최대인 경우가 여러 개일 때에는 입력되는 순서대로 제일 앞쪽에 있는 단어를 답으로 한다. 즉, 답으로 S라는 문자열과 T라는 문자열을 출력한다고 했을 때, 우선 S가 입력되는 순서대로 제일 앞쪽에 있는 단어인 경우를 출력하고, 그런 경우도 여러 개 있을 때에는 그중에서 T가 입력되는 순서대로 제일 앞쪽에 있는 단어인 경우를 출력한다.

입력
첫째 줄에 N(2 ≤ N ≤ 20,000)이 주어진다. 다음 N개의 줄에 알파벳 소문자로만 이루어진 길이 100자 이하의 서로 다른 영단어가 주어진다.

출력
첫째 줄에 S를, 둘째 줄에 T를 출력한다. 단, 이 두 단어는 서로 달라야 한다. 즉, 가장 비슷한 두 단어를 구할 때 같은 단어는 제외하는 것이다.

 

 

 

문자열을 인덱스로, 인덱스를 문자열로 반환하는 두 딕셔너리를 생성한다.

그 후 문자열을 정렬하여서 각 요소를 탐색한다.

이때 i번째 문자열과 가장 많이 유사할 수 있는 단어는 i+1번째 단어부터이다.

유사한 개수가 달라질 때 해당 반복문을 종료하고 같다면 먼저 생성된 순서에 따라 출력을 해야 하므로 예외처리를 진행한다.

 

더보기
더보기
import heapq
import sys

n = int(sys.stdin.readline())

subs = [sys.stdin.readline().rstrip() for _ in range(n)]

index_to_text = {}
text_to_index = {}
for i in range(n):
    index_to_text[i] = subs[i]
    text_to_index[subs[i]] = i

subs.sort()


result = [0, 1]

max_v = 0
prev = -1
for i in range(n-1):
    for j in range(i+1, n):
        for v in range(min(len(subs[i]), len(subs[j]))):
            if subs[i][v] != subs[j][v]:
                break
        else:
            v += 1
    
        if prev > v: break
        prev = v
    
        if max_v < v:
            result = [text_to_index[subs[i]], text_to_index[subs[j]]]
            max_v = v
        elif max_v == v:
            if min(result) > min(text_to_index[subs[i]], text_to_index[subs[j]]):
                result = [text_to_index[subs[i]], text_to_index[subs[j]]]
                max_v = v
            elif min(result) == min(text_to_index[subs[i]], text_to_index[subs[j]]):
                if max(result) > max(text_to_index[subs[i]], text_to_index[subs[j]]):
                    result = [text_to_index[subs[i]], text_to_index[subs[j]]]
                    max_v = v

print(index_to_text[min(result)])
print(index_to_text[max(result)])