일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 포스코 아카데미
- 삼성SDS Brightics
- Brightics Studio
- 삼성 SDS Brigthics
- Brigthics Studio
- 영상제작기
- 추천시스템
- 포스코 청년
- Brightics를 이용한 분석
- 모델링
- Brigthics를 이용한 분석
- 팀 분석
- 혼공머신
- 삼성 SDS
- 삼성SDS
- Brightics
- 혼공머신러닝딥러닝
- 데이터분석
- 개인 의료비 예측
- 삼성SDS Brigthics
- 혼공학습단
- 데이터 분석
- 혼공
- 브라이틱스 서포터즈
- 캐글
- 노코드AI
- 직원 이직률
- 브라이틱스
- Brigthics
- 직원 이직여부
- Today
- Total
데이터사이언스 기록기📚
[이것이 취업을 위한 코딩테스트다 with 파이썬] Ch.7 이진 탐색 본문
[이것이 취업을 위한 코딩테스트다 with 파이썬] Ch.7 이진 탐색
syunze 2022. 4. 22. 19:321. 범위를 반씩 좁혀가는 탐색
순차 탐색
- 이진 탐색 알고리즘 : 리스트 내에서 데이터를 매우 빠르게 탐색
- 순차 탐색(Sequential Search) : 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법
- 정렬되지 않은 리스트에서 데이터 찾아야 할 때 사용
- 리스트 내에 데이터가 아무리 많아도 시간만 충분하면 항상 원하는 데이터를 찾을 수 있다.
- 사용되는 예시
- 리스트에 특정 값의 원소가 있는지 체크
- 리스트 자료형에서 특정한 값을 가지는 원소의 개수 세는 count() 메서드 이용
- 순차 탐색 소스코드
# 순차 탐색 소스코드 구현
def sequential_search(n, target, array):
# 각 원소를 하나씩 확인하며
for i in range(n):
# 현재의 원소가 찾고자 하는 원소와 동일한 경우
if array[i] == target:
return i + 1 # 현재의 위치 반환(인덱스는 0부터 시작하므로 1 더하기)
print("생성할 원소 개수를 입력한 다음 한 칸 띄고 찾을 문자열을 입력하세요.")
input_data = input().split()
n = int(input_data[0]) # 원소의 개수
target = input_data[1] # 찾고자 하는 문자열
print("앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.")
array = input().split()
# 순차 탐색 수행 결과 출력
print(sequential_search(n, target, array))
- 순차탐색 특징
- (데이터 정렬 여부와 상관 없이) 가장 앞에 있는 원소부터 하나씩 확인
- 최악의 시간복잡도 O(N)
이진 탐색 : 반으로 쪼개면서 탐색하기
- 이진탐색(Binary Search)
1) 배열 내부의 데이터가 정렬되어 있어야만 사용할 수 있는 알고리즘.
2) 위치를 나타내는 변수 3개(시작점, 끝점, 중간점) 중 찾으려는 데이터 vs 중간점 데이터 반복적 비교
- 특징
- 데이터 무작위일 떄는 사용할 수 X, 정렬되어 있다면 매우 빠르게 데이터 찾을 수 있다.
- 탐색 범위를 절반씩 좁혀가며 데이터 탐색 (퀵 정렬과 공통점)
- 시간 복잡도 O(logN) : 한 번 확인할 때마다 확인하는 원소의 개수가 절반씩 줄어
- 예시
- 구현방법
1) 재귀 함수
# 이진 탐색 - 재귀함수
def binary_search(array, target, start, end):
if start > end:
return None
mid = (start + end) // 2
if array[mid] == target:
return mid
elif array[mid] > target:
return binary_search(array, target, start, mid - 1)
else:
return binary_search(array, target, mid + 1, end)
n, target = list(map(int, input().split()))
array = list(map(int, input().split()))
result = binary_search(array, target, 0, n - 1)
if result == None:
print("원소가 존재하지 않습니다.")
else:
print(result + 1)
2) 반복문
# 이진 탐색 - 반복문
def binary_search(array, target, start, end):
while start <= end:
mid = (start + end) // 2
if array[mid] == target:
return mid
elif array[mid] > target:
end = mid - 1
else:
start = mid + 1
return None
n, target = list(map(int, input().split()))
array = list(map(int, input().split()))
result = binary_search(array, target, 0, n - 1)
if result == None:
print('원소가 존재하지 않습니다.')
else:
print(result + 1)
- 코딩 테스트에서의 이진 탐색
- 이진 탐색은 코딩 테스트에서 단골, 외우기!
- 이진 탐색 + 다른 알고리즘 → 이진 탐색만 암기해도 꽤 도움 됨
- 탐색 범위가 큰 상황 (2,000만을 넘어갈 때) → 이진 탐색으로 접근
트리 자료구조
- 트리 자료구조 : 노드와 노드의 연결로 표현 (노드 : 정보의 단위, 어떠한 정보를 가지고 있는 개체로 이해가능)
- 그래프 자료구조의 일종
- 데이터베이스 시스템, 파일 시스템의 많은 양의 데이터를 관리하기 위한 목적으로 사용
- 특징
- 트리는 부모 노드, 자식 노드의 관계로 표현
- 최상단 노드 : 루트 노드
- 최하단 노드 : 단말 노드
- 서브 트리 : 트리에서 일부를 떼어낸 트리 구조
- 트리는 계층적이고 정렬된 데이터를 다루기에 적합
→ 큰 데이터를 처리하는 소프트웨어는 데이터를 트리 자료구조로 저장, 이진 탐색 기법을 이용해 빠르게 탐색 가능
이진 탐색 트리
- 이진 탐색 트리 : 이진 탐색이 동작할 수 있도록 고안된, 효율적인 탐색이 가능한 알고리즘
- 특징
- 왼쪽 자식 노드 < 부모 노드 < 오른쪽 자식 노드
- 예제
- 빠르게 입력받기
- 이진 탐색 문제 - 입력 데이터 많거나(1,000만 개 이상), 탐색 범위 매우 넓음(1,000억 이상)
# 입력 데이터가 많을 때 사용하는 방법
import sys
# 하나의 문자열 데이터 입력받기
input_data = sys.stdin.readline().rstrip()
# rstrip 꼭 입력 - 엔터 공백문자 제거
# 입력받은 문자열 그대로 출력
print(input_data)
📌2. 부품 찾기
✔️문제
부품이 N개, 종류는 M개인 전자 매장.
손님이 문의한 부품 M개 종류를 모두 확인해서 견적서 작성해야한다.
이때 가게 안에 부품이 모두 있는지 확인하는 프로그램 작성하기.
✔️입력 조건
- 첫째 줄에 정수 N이 주어진다.(1 <= N <= 1,000,000)
- 둘째 줄에는 공백으로 구분하여 N개의 정수가 주어진다. 이때 정수는 1보다 크고 1,000,000이하이다.
- 셋째 줄에는 정수 M이 주어진다. (1 <= M <= 100,000)
- 넷째 줄에는 공백으로 구분하여 M개의 정수가 주어진다. 이때 정수는 1보다 크고 1,000,000이하이다.
✔️출력 조건
첫째 줄에 공백으로 구분하여 각 부품이 존재하면 yes를, 없으면 no를 출력한다.
✔️입력 예시
5
8 3 7 9 2
3
5 7 9
✔️출력 예시
no yes yes
✔️나의 문제풀이
- 입력 정수 크기 고려 안했을 때는 가능, 고려한다면 시간 복잡도에서 틀릴 풀이
n = int(input())
list_n = list(map(int,input().split()))
m = int(input())
list_m = list(map(int,input().split()))
total = []
list_n.sort()
for i in range(len(list_m)):
for j in range(len(list_n)):
if list_m[i] == list_n[j]:
ans = 'yes'
break
else:
ans = 'no'
total.append(ans)
print(*total)
- 이진탐색 재귀함수 이용한 풀이(시간복잡도도 만족)
n = int(input())
list_n = list(map(int,input().split()))
m = int(input())
list_m = list(map(int,input().split()))
total = []
list_n.sort()
def find_num(m_num, start,end):
# start를 늘리고 end를 줄여가면 -> 리스트 내에 없을 시, start와 end 번호 역전
if start > end:
return 'no'
mid = (start + end) // 2
if list_n[mid] == m_num:
return 'yes'
elif list_n[mid] < m_num:
return find_num(m_num, mid+1 ,end)
else:
return find_num(m_num, start ,end-1)
for i in range(len(list_m)):
ans = find_num(list_m[i], 0, len(list_n) - 1)
total.append(ans)
print(*total)
✔️책의 문제 풀이
1) 이진탐색 - 반복문
# 이진 탐색(반복문) - N개의 부품 정렬, M개의 찾고자 하는 부품 점검 확인
def binary_search(array, target, start, end):
while start <= end:
mid = (start + end) // 2
# 찾은 경우 중간점 인덱스 반환
if array[mid] == target:
return mid
# 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
elif array[mid] > target:
end = mid - 1
# 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
else:
start = mid + 1
return None
# N 입력
n = int(input())
# 가게에 있는 전체 부품 번호 공백으로 구분하여 입력
array = list(map(int, input().split()))
array.sort() # 이진 탐색을 수행하기 위해 사전에 정렬 수행
# M 입력
m = int(input())
# 손님이 확인 요청한 전체 부품 번호를 공백으로 구분하여 입력
x = list(map(int, input().split()))
# 손님이 확인 요청한 부품 번호를 하나씩 확인
for i in x :
# 해당 부품이 존재하는지 확인
result = binary_search(array, i, 0, n - 1)
if result != None:
print('yes', end = ' ')
else:
print('no', end = ' ')
2) 계수 정렬
- 인덱스가 상품 종류, 상품 종류가 있으면 1로 표시
# 계수 정렬
n = int(input())
array = [0] * 1000001
# 가게에 있는 전체 부품 번호를 입력 받아서 기록
for i in input().split():
array[int(i)] = 1
# M을 입력 받기
m = int(input())
# 손님이 확인 요청한 전체 부품 번호를 공백으로 구분하여 입력
x = list(map(int, input().split()))
# 손님이 확인 요청한 부품 번호를 하나씩 확인
for i in x:
# 해당 부품이 존재하는지 확인
if array[i] == 1:
print('yes', end = ' ')
else:
print('no', end = ' ')
3) 집합 자료형
# 집합 자료형
n = int(input())
array = set(map(int, input().split()))
m = int(input())
x = list(map(int, input().split()))
for i in x:
# 해당 부품이 존재하는지 확인
if i in array:
print('yes', end = ' ')
else:
print('no', end = ' ')
✔️나의 문제풀이와 책의 문제풀이 비교
- 이진 탐색 코드 암기하기.
📌3. 떡볶이 떡 만들기
✔️문제
한 봉지 안에 들어가는 떡의 총 길이는 절단기로 잘라서 맞춰준다.
절단기에 높이(H)를 지정하면 줄지어진 떡을 한 번에 절단한다. 높이가 H보다 긴 떡은 H 위의 부분이 잘릴 것이고, 낮은 떡은 잘리지 않는다.
ex) 높이 19, 14, 10, 17 떡이 나란히 있고 절단기 높이를 15로 지정하고 자름 -> 자른 뒤 떡의 높이 15, 14, 10, 17
잘린 떡의 길이는 차례대로 4, 0, 0, 2cm여서 손님은 6cm만큼 길이를 가져간다.
손님이 왔을 때 요청한 길이가 M일때, 적어도 M만큼의 떡을 얻기 위해 절단기에 설정할 수 있는 높이의 최댓값 구하기.
✔️입력 조건
- 첫째 줄에 떡의 개수 N과 요청한 떡의 길이 M이 주어진다. (1 <= N <= 1,000,000, 1 <= M <= 2,000,000,000)
- 둘째 줄에는 떡의 개별 높이가 주어진다. 떡 높이의 총합은 항상 M 이상이므로, 손님은 필요한 양만큼 떡을 사갈 수 있다. 높이는 10억보다 작거나 같은 양의 정수 또는 0이다.
✔️출력 조건
적어도 M만큼의 떡을 집에 가져가기 위해 절단기에 설정할 수 있는 높이의 최댓값을 출력한다.
✔️입력 예시
4 6
19 15 10 17
✔️출력 예시
15
✔️나의 문제 풀이
- 방법1) 이진 탐색이 아닌 그냥 하나씩 탐색, 시간복잡도 매우 높을 것...!
n, m = map(int,input().split())
length = list(map(int, input().split()))
length.sort(reverse = True)
def check(target):
# length 리스트에서 제일 큰 값 기준으로 하나씩 줄여가며 비교
for t in range(target, 0, -1):
result = 0
for i in length:
sum = i - t
# 리스트 값 - target 중 0인지 아닌지 조건 지정
if sum > 0 :
sum = sum
else:
sum = 0
result += sum
# result == m이면 종료
if result == m:
print(t)
break
check(length[0])
- 방법2) 이진탐색 이용
- 리스트에 있는 값이 답 : 이진탐색 이용
- 리스트에 없는 값이 답 : 이진탐색 후, 마지막으로 나온 값(height[mid])와 height[mid+1] 사이값 전체 탐색
n,m = map(int,input().split())
height = list(map(int,input().split()))
height.sort()
def binary_search(height, start, end):
total = 0
mid = (start + end) // 2
# 리스트에 없는 값이 답이므로, height[mid]와 height[mid+1] 사이값 탐색 준비
if start > end:
return height[mid], height[mid+1] - height[mid]
for x in height:
num = x - height[mid]
if num > 0:
total += num
if total == m:
return (height[mid],'true')
elif m > total:
return binary_search(height, start, mid - 1)
else:
return binary_search(height, mid + 1, end)
if binary_search(height, 0, n-1)[1] == 'true':
print(binary_search(height, 0, n-1)[0])
else:
# 리스트에 없는 값 탐색하기
for i in range(1,binary_search(height, 0, n-1)[1]):
total = 0
search = binary_search(height, 0, n-1)[0] + i
for x in height:
num = x - search
if num > 0:
total += num
if total == m:
print(search)
break
✔️책의 문제 풀이
- 전형적인 이진 탐색 문제
- 파라메트릭 서치 : 최적화 문제를 결정 문제로 바꾸어 해결 (원하는 조건을 만족하는 가장 알맞은 값을 찾는 문제)
→ 반복문을 이용하여 간결하게 문제 풀 수 있음
→ 보통 이진탐색 이용
ex) 범위 내에서 조건을 만족하는 가장 큰 값을 찾는 최적화 문제 → 이진탐색으로 결정 문제 해결하며 좁혀감
- 아이디어 : 적절한 높이를 찾을 때까지 절단기의 높이 H를 반복하여 조정(조건 → 조건 만족 여부 → 탐색 범위 좁히기)
- 리스트 내의 범위만 탐색하는 것이 아닌, 0부터 리스트 가장 큰 값까지를 범위로 설정
- 0~19 사이를 이진탐색으로 찾기
- 큰 수를 보면 당연히 이진 탐색 떠올리기
# 떡의 개수(N)와 요청한 떡의 길이(M)을 입력받기
n,m = list(map(int, input().split(' ')))
# 각 떡의 개별 높이 정보를 입력받기
array = list(map(int, input().split()))
# 이진 탐색을 위한 시작점과 끝점 설정
start = 0
end = max(array)
# 이진 탐색 수행(반복적)
result = 0
while (start <= end):
total = 0
mid = (start + end) // 2
for x in array:
# 잘랐을 때의 떡의 양 계산
if x > mid:
total += x - mid
# 떡의 양이 부족한 경우 더 많이 자르기(왼쪽 부분 탐색)
if total < m:
end = mid - 1
# 떡의 양이 충분한 경우 덜 자르기(오른쪽 부분 탐색)
else:
# 최대한 덜 잘랐을 때가 정답이므로, 여기에 result에 기록
# mid값이 크면 클 수록 덜 잘림, 이진탐색 최대한 이용해야 함
result = mid
start = mid + 1
# 정답 출력
print(result)
✔️나의 문제풀이와 책의 문제풀이 비교
- 나의 문제풀이 : 리스트 내 값을 이진탐색 → 이후 return값과 다음값 사이 순차 비교
- 책의 문제풀이 : 0~끝 길이까지 이진탐색
'Coding Test > 이것이 취업을 위한 코딩테스트이다 with 파이썬' 카테고리의 다른 글
[이것이 취업을 위한 코딩테스트다 with 파이썬] Ch.9 최단 경로 (0) | 2022.04.29 |
---|---|
[이것이 취업을 위한 코딩테스트다 with 파이썬] Ch.8 다이나믹 프로그래밍 (0) | 2022.04.29 |
[이것이 취업을 위한 코딩테스트다 with 파이썬] Ch.6 정렬 (0) | 2022.04.19 |
[이것이 취업을 위한 코딩테스트다 with 파이썬] Ch.4 구현 (0) | 2022.04.14 |
[이것이 취업을 위한 코딩테스트다 with 파이썬] Ch.3 그리디 (0) | 2022.03.25 |