Contents
see List프로젝트 개요
소프트모아는 연구기관을 위한 전자문서 및 논문 관리 시스템을 구축하였습니다. XML 기반 구조화 문서 파싱, 수식 렌더링(MathML), 전자북 변환, 메타데이터 관리, 버전 관리 등을 통해 연구 문서의 체계적인 관리와 효율적인 검색을 지원합니다. 대용량 PDF 처리, 전문 검색 엔진, 인용 추적 등 학술 연구에 특화된 기능을 제공합니다.
주요 기능
| 모듈/기능 | 주요 기능/설명 |
|---|---|
| 문서등록 | XML/PDF 업로드, 메타데이터 자동 추출, 카테고리 분류 |
| XML 파싱 | JATS, DocBook 등 학술 XML 표준 파싱, 구조화 문서 저장 |
| 수식 렌더링 | MathML, LaTeX 수식 지원, 브라우저 기반 렌더링 |
| 전자북 변환 | PDF → ePub 변환, 뷰어 내장, 주석/하이라이트 기능 |
| 전문검색 | ElasticSearch 기반 전문 검색, 형태소 분석, 패싯 필터 |
| 버전관리 | 문서 개정 이력, Diff 비교, 롤백 기능 |
| 인용추적 | 참고문헌 자동 파싱, 인용 네트워크 시각화 |
기술 스택
- Backend: Python, Django, Celery (비동기 작업)
- Frontend: Vue.js, MathJax (수식 렌더링)
- Database: PostgreSQL, ElasticSearch (전문 검색)
- Storage: MinIO (S3 호환 객체 스토리지)
- Document Processing: Apache Tika, PyPDF2, BeautifulSoup
성과
- 논문 검색 시간 평균 5분 → 10초로 단축
- XML 기반 구조화 문서로 재활용성 향상
- 수식 렌더링 정확도 95% 이상 달성
- 전자북 변환으로 모바일 열람률 40% 증가
