마이크로소프트 OneDrive 에서 문서를 인덱싱하는 것과 유사하게, Alli 가 지정된 HTML 페이지에서 문서를 생성하여 지식 베이스에 추가하도록 할 수 있습니다. 어떻게 하는지 알아보겠습니다.

지식 베이스 > 소스 설정으로 이동하면 가능한 문서 소스로 OneDrive 와 HTML 문서를 확인할 수 있습니다. HTML 문서 항목의 추가 버튼을 클릭합니다.

아래와 같은 팝업이 출력됩니다. URL 필드에 데이터를 가져오고자 하는 HTML 페이지의 URL 주소를 입력합니다. 해당 페이지는 반드시 퍼블릭 페이지여야 한다는 점 유의하시기 바랍니다. 여기에서 문서의 이름을 어떻게 결정할지도 선택할 수 있습니다. 문서 이름으로는 URL 을 사용하거나 HTML 문서 제목을 사용할 수 있습니다.

'하위 URL Regex' 필드 아래의 '하위 URL 사용하기'를 체크하면 메인 URL 에 존재하는 링크들에서 컨텐츠를 가져오게 설정할 수 있습니다. 정규표현식을 사용해 어떤 URL 에서 컨텐츠를 가져올지 결정할 수 있는데요, 예를 들어 아래와 같이 입력하면 'https://example.allganize.ai/' 페이지에 있는 링크들 중 'https://example.allganize.ai/' 로 시작하는 모든 링크들에서 텍스트를 가져옵니다.

하나 더 예를 들자면, 하위 URL Regex를 'https://example.allganize.ai/product.*' 로 설정한 경우 https://example.allganize.ai/ 도메인에서 product 로 시작하는 모든 페이지에서 텍스트를 가져옵니다. 예를 들어 'https://example.allganize.ai/product_alli' 혹은 'https://example.allganize.ai/product/alli' 등입니다.

하위 URL 사용하기를 활성화하면 메인 URL 에 있는 정보는 가져오지 않는다는 점 기억하시기 바랍니다.

저장 버튼을 누르면 아래와 같이 HTML 문서 항목에 소스가 추가된 것을 볼 수 있습니다. 문서 이름은 수초 후 (가져올 데이터가 많은 경우 시간이 더 걸릴 수 있습니다) 페이지를 새로고침하면 보여집니다. 상태 토글이 켜져있으면 UTC 오전 12시마다 자동으로 인덱싱이 진행되어 문서를 항상 최신 상태로 유지합니다.

생성된 문서는 문서 탭 아래에서 찾을 수 있습니다.


올거나이즈는 기업을 위한 자연어 이해 AI 솔루션을 제공합니다.