1062번: 가르침
첫째 줄에 단어의 개수 N과 K가 주어진다. N은 50보다 작거나 같은 자연수이고, K는 26보다 작거나 같은 자연수 또는 0이다. 둘째 줄부터 N개의 줄에 남극 언어의 단어가 주어진다. 단어는 영어 소문
www.acmicpc.net
문제
남극에 사는 김지민 선생님은 학생들이 되도록이면 많은 단어를 읽을 수 있도록 하려고 한다. 그러나 지구온난화로 인해 얼음이 녹아서 곧 학교가 무너지기 때문에, 김지민은 K개의 글자를 가르칠 시간 밖에 없다. 김지민이 가르치고 난 후에는, 학생들은 그 K개의 글자로만 이루어진 단어만을 읽을 수 있다. 김지민은 어떤 K개의 글자를 가르쳐야 학생들이 읽을 수 있는 단어의 개수가 최대가 되는지 고민에 빠졌다.
남극언어의 모든 단어는 "anta"로 시작되고, "tica"로 끝난다. 남극언어에 단어는 N개 밖에 없다고 가정한다. 학생들이 읽을 수 있는 단어의 최댓값을 구하는 프로그램을 작성하시오.
입력
첫째 줄에 단어의 개수 N과 K가 주어진다. N은 50보다 작거나 같은 자연수이고, K는 26보다 작거나 같은 자연수 또는 0이다. 둘째 줄부터 N개의 줄에 남극 언어의 단어가 주어진다. 단어는 영어 소문자로만 이루어져 있고, 길이가 8보다 크거나 같고, 15보다 작거나 같다. 모든 단어는 중복되지 않는다.
출력
첫째 줄에 김지민이 K개의 글자를 가르칠 때, 학생들이 읽을 수 있는 단어 개수의 최댓값을 출력한다.
==========================================================
비트 마스킹과 브루트 포스를 활용한 문제입니다.
만약 k개의 단어를 사용하는 조합을 모두 구해 알고리즘을 진행한다면,
전체 조합의 가짓수는 $_nC_k = n!/k!(n-k)!$ 가 될것이고, 최댓값은 k =13일때 10400600입니다. (대략 천만 가지정도)
이때, 비트 연산 없이 해당 단어와 배운 단어의 조합만을 가지고 비교연산을 진행한다면, 단어를 구성하는 알파벳의 개수에 따라 최대 O(13 * 50) 이 소요되므로, (조합 비교 연산의 시간복잡도 작은 조합의 크기를 따라갑니다)
시간초과가 발생할 수 있습니다.
이 문제를 해결하기 위해, 비트마스킹을 활용하면, 상술한 비교 연산을 O(50) 안에 끝낼 수 있습니다.
루프문을 실행해 k개의 알파벳을 선택해 가르치는 모든 경우를 확인하며,
각 단어마다 비트를 저장하는 배열을 만들어 해당 단어에 포함된 알파벳에 대응하는 비트를 1로 바꾸어줍니다.
(A = 0번 비트 ... Z는 25번 비트) 이렇게 단어별 비트를 저장)
이 때, 가르칠 알파벳 나타낸 비트마스킹 값을 $Bit_t$, $i$번째 단어를 나타낸 비트마스킹 값을 $Bit_i$라고 할 때,
$Bit_i & Bit_t = Bit_i$ 인 경우, $i$번째 단어에 필요한 알파벳을 모두 가르쳤다는 의미와 같으므로, 카운트를 +1 해줍니다.
이렇게 모든 단어를 확인하며 최대 카운트 값을 갱신해주면, 루프문이 끝났을 때 가르칠 수 있는 최대 단어의 개수를 알 수 있습니다.
여기서, 조금 더 최적화를 진행해보겠습니다.
문제의 조건에 따라 남극단어는 접두사로 anta, 접미사로 tica를 가집니다.
때문에, 배울 수 있는 알파벳의 수가 5개(a,c,i,n,t) 보다 적은 경우, 배울 수 있는 단어의 수는 0개라고 단언할 수 있으며
상술한 5개의 알파벳을 제외한, 21개의 알파벳 중에서 (k-5)개를 뽑아 가르치는 것으로 생각이 가능합니다.
이렇게 하면, 경우의 수를 최대 352716(대략 35만가지) 수준으로 줄일 수 있습니다.
또한, 모든 단어에서 사용되지 않는 알파벳은 가르칠 필요가 없으므로, 이 또한 남은 21개의 알파벳에서 제거해준다면,
평균적으로 매우 적은 경우의 수를 확인하면서 최댓값을 구할 수 있습니다.
import sys
from itertools import combinations
input = sys.stdin.readline
n,m = map(int,input().split())
baseSet = {"a","c","i","n","t"}
#필요한 알파벳으로만 조합을 뽑으면 됨
alphabet = set()
wordBits = []
for _ in range(n):
word = set(list(input().rstrip())) - baseSet #필요한 단어 개수
if len(word) > m - 5: continue #완성 못하는 언어는 바로 패스
alphabet = alphabet.union(word) #알파벳에 합집합
bit = 0
for s in word: bit |= (1 << (ord(s) - ord("a")))
wordBits.append(bit) #비트에 추가
if not wordBits: #만들 수 있는 단어가 없으면 볼 이유가 없음
print(0)
exit(0)
ans = 0
for usingAlphabet in list(combinations(alphabet,min(len(alphabet),m-5))):#둘중 작은걸로 조합을 뽑음
bit = 0
cnt = 0
for s in usingAlphabet: bit |= (1 << (ord(s) - ord("a")))
for wordBit in wordBits: cnt += bit & wordBit == wordBit #연산해서 자기 자신이 나온다 -> 완성이 가능하다
ans = max(ans,cnt)
print(ans)
'PS > BOJ (Baekjoon Online Judge)' 카테고리의 다른 글
[BOJ_Gold 4] 11559 - Puyo Puyo [python] (0) | 2022.03.12 |
---|---|
[BOJ_Platinum 4] 24520 - Meet in the middle [python] (0) | 2022.02.27 |
[BOJ_Gold 3] 14442-벽 부수고 이동하기 2 [python] (0) | 2022.02.07 |
[BOJ_Platinum 3] 13445-부분수열 XOR [python] (0) | 2022.02.05 |
[BOJ_Platinum 2] 10256-돌연변이 [python] (0) | 2022.02.03 |