프로젝트 개요


소프트모아는 연구기관을 위한 전자문서 및 논문 관리 시스템을 구축하였습니다. XML 기반 구조화 문서 파싱, 수식 렌더링(MathML), 전자북 변환, 메타데이터 관리, 버전 관리 등을 통해 연구 문서의 체계적인 관리와 효율적인 검색을 지원합니다. 대용량 PDF 처리, 전문 검색 엔진, 인용 추적 등 학술 연구에 특화된 기능을 제공합니다.



주요 기능











모듈/기능주요 기능/설명
문서등록XML/PDF 업로드, 메타데이터 자동 추출, 카테고리 분류
XML 파싱JATS, DocBook 등 학술 XML 표준 파싱, 구조화 문서 저장
수식 렌더링MathML, LaTeX 수식 지원, 브라우저 기반 렌더링
전자북 변환PDF → ePub 변환, 뷰어 내장, 주석/하이라이트 기능
전문검색ElasticSearch 기반 전문 검색, 형태소 분석, 패싯 필터
버전관리문서 개정 이력, Diff 비교, 롤백 기능
인용추적참고문헌 자동 파싱, 인용 네트워크 시각화


기술 스택



  • Backend: Python, Django, Celery (비동기 작업)

  • Frontend: Vue.js, MathJax (수식 렌더링)

  • Database: PostgreSQL, ElasticSearch (전문 검색)

  • Storage: MinIO (S3 호환 객체 스토리지)

  • Document Processing: Apache Tika, PyPDF2, BeautifulSoup



성과



  • 논문 검색 시간 평균 5분 → 10초로 단축

  • XML 기반 구조화 문서로 재활용성 향상

  • 수식 렌더링 정확도 95% 이상 달성

  • 전자북 변환으로 모바일 열람률 40% 증가