Telegram Web Link
PaddleOCR-VL - Baidu가 공개한 0.9B 초소형 비전-언어 모델 다국어 OCR

- 문서 파싱에 최적화된 초소형 비전-언어 모델(VLM) 로, 한국어 포함 109개 언어를 지원하며 수식,표,차트,손글씨 등 복잡한 요소를 정확히 인식함
- 핵심 모델 PaddleOCR-VL-0.9BNaViT 기반 동적 해상도 비주얼 인코더ERNIE-4.5-0.3B 언어 모델 을 결합해 고정밀 인식과 빠른 추론 속도를 동…

https://news.hada.io/topic?id=23795
👍3
DeepSeek OCR

한 줄 요약

문서/대화 기록을 이미지(시각 토큰) 로 바꿔서 LLM 컨텍스트를 크게 줄이고(≈7–20×), 다시 텍스트로 정확히 복원(OCR)하는 광학적 컨텍스트 압축을 제안·검증. 새 비전 인코더(DeepEncoder)와 3B MoE 디코더를 결합해 적은 비전 토큰으로도 SOTA급 문서 파싱 성능을 보입니다.

문제 정의


https://news.hada.io/topic?id=23786
Uber, 운전자가 운전하지 않을 때도 AI 데이터 라벨링 등 ‘부업’ 제공 예정

- 우버가 미국 내 운전자와 배달 파트너들이 운행하지 않을 때도 수익을 얻을 수 있는 새로운 기회 를 제공하는 파일럿 프로그램을 시작함
- AI 데이터 라벨링과 관련된 디지털 작업(digital tasks) 들을 수행하며, 예시로 AI 학습용 이미지 업로드 특정 언어나 억양으로 음성 녹음과 같은 작업 포함 …

https://news.hada.io/topic?id=23796
파인튜닝의 귀환

- 파인튜닝이 AI 개발 방법론의 중심으로 다시 부상 하고 있으며, 이는 Thinking Machines Labs의 Tinker 발표와 자체 관리형 오픈소스 LLM 배포로의 패러다임 전환을 통해 촉발됨
- 한때 AI 추론 워크로드의 10% 미만으로 감소 했던 파인튜닝이 GPU-as-a-service 플랫폼, 안정화된 모델 생태계, 오픈웨이트 …

https://news.hada.io/topic?id=23793
🤔2
Claude Code 웹 버전 공개 — 브라우저에서 직접 코드 작업 시키기 가능

- Anthropic이 Claude Code 웹 버전 을 공개하여, 개발자가 브라우저에서 직접 코드 작업을 위임 할 수 있게 함
- GitHub 저장소 연결 후 작업을 설명하면, Claude가 클라우드 환경에서 자동 구현 하며 동시 다중 작업(parallel tasks) 을 지원함
- 각 세션은 격리된 샌드박스 환경 에서 실행되어 보…

https://news.hada.io/topic?id=23804
👍2
알리바바 클라우드, GPU 풀링 시스템 ‘Aegaeon’으로 엔비디아 GPU 사용량 82% 절감

- 알리바바 클라우드가 개발한 Aegaeon 풀링 시스템GPU 활용 효율을 9배 높여 , 동일한 LLM 서비스에 필요한 엔비디아 GPU 수를 82% 줄였음
- 이 시스템은 GPU를 모델별로 고정하지 않고 토큰 단위로 가상화하여 공유 풀에서 동적으로 스케줄링 함으로써 여러 모델이 한 GPU를 동시에 사용 하도록 …

https://news.hada.io/topic?id=23805
오늘은 아마존의 인재 유출로 인해 AWS가 마침내 망가진 날

- 이번 AWS US-EAST-1 지역 장애 는 단순한 기술 결함이 아니라, 핵심 인력 유출 로 인한 조직적 약화의 신호로 분석됨
- 장애의 원인은 여전히 고전적인 DNS 문제 로 밝혀졌으며, DynamoDB API 엔드포인트 오류 로 인해 다른 서비스가 연쇄적으로 중단됨
- 과거 **시스템의 실패 패턴을 기억하는 베테랑…

https://news.hada.io/topic?id=23806
👍6
오픈소스 전반에 관한 컨퍼런스 : FOSS for All Conference 2025 개최

FOSDEM, COSCUP, FOSSASIA 등 해외의 자유/오픈소스 전반에 관한 컨퍼런스를 모티브로 한 커뮤니티 주도 비영리 컨퍼런스

일정
- 2025년 11월 08일 (토)

장소
- 광운대학교 새빛관, 비마관

참여 커뮤니티
- OpenStreetMap 한국커뮤니티
- VideoLAN
- OSPN OpenSource People Network…

https://news.hada.io/topic?id=23808
q - 초소형 커맨드라인 DNS 클라이언트

- 단일 바이너리로 UDP/TCP부터 DoT/DoH/DoQ/ODoH 까지 폭넓은 전송 방식을 지원하는 작고 강력한 CLI DNS 클라이언트
- 도메인의 기본 레코드 조회부터 특정 서버 쿼리, pretty/raw/json/yaml 등의 다양한 출력 형식까지 지원
- 모든 플래그는 dig 표준 +[no]flag 형태로도 제어 가능
- **ODoH·D…

https://news.hada.io/topic?id=23816
정당성을 확보하는 방법

- "소프트웨어를 어떻게 팔 것인가?" : Microsoft에서 23년 일했고, 윈도우 부문 사장으로 퇴사한 스티븐 시놉스키와의 인터뷰를 정리한 글
- 소프트웨어 기업이 전문가 시장에 진출 하려면 제품의 우수성만으로는 부족하며, 기술적 접근과 비전에 대한 신뢰성과 정당성을 입증 해야 고객의 구매 결정을 이끌…

https://news.hada.io/topic?id=23819
온보딩을 MCP 기반으로 재구성했더니 SDK 설치가 늘었어요

- DevCycle이 MCP 통합을 중심으로 온보딩 절차를 전면 재구성해, 개발자가 처음부터 자신의 코드 에디터 내에서 SDK를 설치하도록 유도한 결과 SDK 설치율이 약 3배 증가
- 기존에는 예제 앱이나 샌드박스를 통한 체험 위주로 설계되어 있었으나, 개발자 입장에서 실제 프로젝트와 무관한 **우회 경로로…

https://news.hada.io/topic?id=23821
Reddit SEO - 검색 엔진과 AI 가시성을 높이는 방법

- Reddit SEO는 프로필·게시글·댓글 최적화 를 통해 Google 검색과 AI 답변 노출 을 확대하는 실천 방법으로, 대화형·실용적 콘텐츠를 바탕으로 가시성을 높임
- Reddit는 2024년 Google–Reddit 데이터 파트너십 이후 오가닉 트래픽 급증 과 함께 Google SERP 및 AI Overviews 에서의 존재감이 확대되었으…

https://news.hada.io/topic?id=23823
AI 덕분에 최소 인력으로 10억 달러 스타트업 구축하기가 가능해짐

- 스타트업 성공의 새로운 패러다임으로, 소규모 팀이 거대한 가치를 창출 하는 방식이 주목받고 있음
- 속도, 명확성, 주인의식 이 소규모 팀에 중요하고, 계층과 조정 비용이 제거되면 의사결정이 직접적이고 신속하게 이루어져 제품 출시 속도가 극대화됨
- 조직 설계는 안티프래질 구조 와 **자율적 팟…

https://news.hada.io/topic?id=23826
5백만 건 이상의 문서를 처리하며 얻은 Production RAG 경험

- 8개월간 RAG(검색 증강 생성) 프로젝트를 진행하며 실제로 효과적인 방법과 시간 낭비였던 방법을 구분함
- 초기에는 Langchain과 Llamaindex 를 사용하여 프로토타입을 빠르게 완성했지만, 실제 사용자 피드백에서 성능 한계를 경험함
- 문서 검색 성능을 개선한 가장 큰 요인은 **쿼리 생성, 리랭킹, 청킹 전략…

https://news.hada.io/topic?id=23812
2025/10/22 04:08:46
Back to Top
HTML Embed Code: