깨진 링크

정의
깨진 링크(broken link)는 웹 페이지, 전자문서, 애플리케이션 등에서 하이퍼링크가 설정된 대상 주소(URL)가 현재 접근이 불가능하거나 존재하지 않을 때 발생하는 상태를 말한다. 사용자는 해당 링크를 클릭했을 때 “404 Not Found”, “403 Forbidden”, “410 Gone” 등과 같은 HTTP 오류 메시지를 보게 되며, 기대했던 콘텐츠를 확인할 수 없다.


1. 발생 원인

구분 주요 원인 상세 내용
주소 변경 페이지 이동·URL 구조 개편 기존 URL이 새 주소로 옮겨졌지만 리다이렉션 설정이 없을 경우
삭제 콘텐츠 삭제·서버 정리 파일이나 페이지 자체가 서버에서 제거됨
오타·잘못된 입력 작성 실수 URL에 오타, 불필요한 공백, 잘못된 인코딩이 포함
서버·네트워크 문제 일시적 장애·도메인 만료 서버 다운, DNS 오류, 도메인 계약 종료 등
외부 의존성 제3자 사이트 링크 상대방 사이트가 운영을 중단하거나 URL 구조를 바꿈
프로토콜/스키마 오류 http/https 혼동, ftp 등 프로토콜이 지원되지 않거나 보안 정책에 의해 차단

2. 종류

  1. 내부 깨진 링크 – 같은 도메인·서버 내에서 발생하는 링크 오류.
  2. 외부 깨진 링크 – 다른 도메인·외부 서버를 대상으로 하는 링크 오류.
  3. 정적 파일 깨짐 – 이미지, PDF, 동영상 등 파일 자체가 손상되었거나 존재하지 않을 때.
  4. 동적 라우팅 오류 – SPA(Single Page Application) 등에서 라우터 설정이 잘못돼 발생하는 경우.

3. 탐지 방법

방법 도구·기법 특징
크롤러 기반 검사 Screaming Frog, Xenu, Sitebulb, Google Search Console “Coverage” 전체 사이트를 자동 스캔, HTTP 상태 코드 기록
브라우저 플러그인 Link Checker (Chrome), Check My Links 실시간 페이지 내 링크 검증, 개발자 친화적
서버 로그 분석 Apache/Nginx access log, 404 error log 실제 사용자 요청 기반 오류 파악
스크립트 Python (requests + BeautifulSoup), Node.js (axios) 맞춤형 검사, API 연동 가능
CMS 내장 기능 WordPress Broken Link Checker 플러그인 콘텐츠 관리 시스템에 직접 통합

4. 처리·예방 방안

  1. 404 페이지 커스터마이징 – 사용자 친화적인 안내, 검색 기능, 사이트맵 제공.
  2. 리다이렉션 설정 – 301(영구 이동) 또는 302(임시 이동)으로 기존 URL을 새 주소에 연결.
  3. 정기적 점검 – 월간·주간 단위 자동 검사 스케줄링.
  4. URL 구조 설계
    • 의미 있는 경로와 계층 유지
    • 가능한 한 영구적인 슬러그 사용
  5. 콘텐츠 보존 정책 – 삭제 전 URL 리다이렉션 계획 수립.
  6. 외부 링크 관리 – 타 사이트 변화 감시를 위한 알림 서비스(예: Ahrefs, Moz) 사용.
  7. 서버/도메인 관리 – 도메인 연장, SSL 인증서 갱신 등 기본 인프라 유지.

5. 관련 용어

  • 404 Not Found: 요청한 리소스를 찾을 수 없을 때 반환되는 HTTP 상태 코드.
  • 301 Moved Permanently: 영구적인 URL 이동을 알리는 리다이렉션 코드.
  • 410 Gone: 리소스가 영구적으로 삭제되어 더 이상 존재하지 않음을 알리는 코드.
  • 리다이렉션 체인(redirect chain): 여러 번 연속된 리다이렉션이 발생하는 상황, 성능 저하와 SEO 영향을 초래.

6. 사례 연구

사이트 문제점 조치
대형 전자상거래몰 (2023) 제품 페이지 URL 재구성 후 15% 페이지 404 발생 301 리다이렉션 일괄 적용, 자동 크롤링 도구로 2주 간격 점검
대학 포털 (2021) 교수 연구 논문 PDF 삭제 → 404 증가 “문서 미삭제 정책” 도입, 삭제 전 파일 보관 및 리다이렉션 구현
블로그 네트워크 (2022) 외부 위키 링크 404 비율 30% 외부 링크 모니터링 서비스와 API 연동, 문제 발생 시 자동 알림

7. 참고 문헌·링크

  1. RFC 7231 – HTTP/1.1 Semantics and Content, Section 6.5.4 (404 Not Found).
  2. Google Search Central – Crawl Errors (https://developers.google.com/search/docs/monitor-debug/crawl-errors)
  3. W3C – Web Content Accessibility Guidelines (WCAG) 2.1 – 오류 페이지 접근성 지침.
  4. “SEO Best Practices for Handling Broken Links” – Moz Blog, 2024.
  5. “링크 검사 도구 비교” – Sitebulb Whitepaper, 2023.

요약
깨진 링크는 웹 환경에서 사용자의 탐색 흐름을 방해하고 SEO 점수와 신뢰성을 저하시키는 중요한 오류이다. 발생 원인을 정확히 파악하고, 자동화된 탐지 도구와 체계적인 리다이렉션·예방 정책을 적용함으로써 사이트 운영 효율성을 크게 향상시킬 수 있다.

둘러보기

더 찾아볼 만한 주제