안녕하세요.
정보보안 및 인공지능 전문기업 컴트루테크놀로지입니다!
컴트루테크놀로지의 AI API Center에서는 다양한 인공지능 서비스를 API 형태로 만나볼 수 있는데요,
오늘은 그 중에서 “행정문서 OCR”에 대해서 알아보려고합니다.
먼저 ‘행정문서’란 우리가 업무를 처리하기 위해 발급, 사용하는 개인 및 기업 관련 행정서류를 말합니다.
개인 행정문서에서는 주민등록표(등,초본), 가족관계증명서, 기본증명서, 개인인감증명서가 있습니다.
또한 기업 행정문서로는 사업자등록증, 법인인감증명서가 있습니다.
컴트루테크놀로지의 ‘행정문서 OCR’ 은 이러한 개인 및 기업의 행정문서 이미지를
자체개발한 인공지능 신경망을 활용하여 인식하여 텍스트로 변환합니다.
행정문서 OCR은 전체 텍스트를 인식하는 General OCR과
특정 영역의 텍스트를 인식하는 Template OCR을 모두 제공합니다.
위 예시와 같이 사업자등록증 이미지에 대한 행정문서 OCR – Template OCR을 활용하여
사업자등록증에 기재된 정보를 텍스트 형태로 추출할 수 있습니다.
예) 사업자 종류 : 법인사업자
등록번호 : 220-81-*****
법인명(단체명) : (주)컴트루테크놀로지
…….
이는 다양한 RPA 솔루션 혹은 업무 시스템과 연동하여 사용할 수 있습니다.
지금까지 업무 시스템에 수기방식으로 입력해야했던 정보도 이러한 OCR 기술과 함께
자동으로 입력하면서, 불필요한 업무를 제거하여 업무 효율성을 높일 수 있습니다.
행정문서 OCR은 물론 다양한 문서 서식에 대한 OCR도 가능합니다.
계약서, 약정서 등 비즈니스에서 사용되는 ‘양식’이 존재하는 문서라면 문서 OCR이 가능합니다.
cometrue.ai의 행정문서 OCR! 어떤 점이 좋을까요?
이미지 영역 검출 신경망 활용
이미지에서 문서의 사각형 영역을 검출할 때도 자체개발 인공지능 신경망을 활용합니다.
– 코너를 바로 찾아 사각형(문서)영역을 인지
– 교차점 사이에 장애물이 있어도 인지
– 꼭지점 하나가 없더라도 문서 영역 인지 (삼각)
– 해당 영역은 평면화 처리하여 문자 추출하기 좋은 상태로 변경
텍스트 영역 검출 신경망 활용
이미지 속 텍스트 영역을 검출할 때도 자체개발 인공지능 신경망을 활용합니다.
– 이미지 전처리 없이 해당 이미지 내에서 텍스트 영역 검출
– 실환경 이미지(휴대폰 카메라 사진촬영 이미지, 신분증 등)에서도 텍스트 영역 검출
– 문서 기울기 보정 불필요, 휘어진 글자와 가로/세로 문자 배열에 대해서도 탁월한 텍스트 영역 검출
표 인식 및 표 OCR 지원
자체개발한 표 검출 인공지능 신경망을 활용하여 문서내에서 표를 인식하고,
표 구조를 인식하여 표의 글자를 추출합니다.
해당 표에서 얻을 수 있는 정보와 해당 정보에 대한 결과 값을 매칭하여 결과로 전달할 수 있습니다.
예) 진료비 영수증에서 ‘공단부담 진료비 = O,OOO원’
다양한 문서서식 OCR 지원
위에 소개한 개인, 기업의 행정문서 뿐만 아니라
국내에 통용되는 다양한 문서에 대한 OCR이 가능합니다.
계약서, 약정서 등 OCR이 필요한 문서가 있다면, 지금 컴트루테크놀로지에 문의 하세요!