문리더+ tts 필터Ⅱ


위치는 기타설정/TTS 설정/TTS 문자 필터

아래설정은 괄호안의 한자, 일본어, 영문등은 스킵하고 길게 늘어지는 의성어는 짧게 줄임.
말줄임표와 쉼표는 마침표로 치환하고 #, *은 스킵 또는 하나로 줄이고 몇몇 기호문자는 스킵.

아래 내용을 확장자는 .ttsfilter로 이름은 현재 불러들인 텍스트이름으로 저장하고 TTS문자필터에서 불러오기. 또는 이름을 임의로 정하고 경로명을 정확히 입력하고 불러오기.
필요한 부분만 쓴다면 #->#은 제외하고 하나씩 입력해도 됨.

한자와 영문등 많은 부분에 정규표현식을 사용했으니 필터에 정규식사용에 체크.

[—ㅡ_]|[ㅠㅜ]|ㅂㅅ|-$|\[|\.?\]#->#
[♥♣♠◀▶★♩♪♫♬]#->#
;|……?\.?#->#,
([\.\* ?]){2,}#->#$1
- ?(\D)#->#$1
(?m)^#\d+화?.*#->#*
\(([一-鿕]|[㐀-䶵]|[豈-龎]).*?\)#->#
\([a-zA-Z].*?\)#->#
\([ぁ-ー].*?\)#->#
(가){3,}|(과){3,}|(구){3,}#->#$1$1$1$2$2$2$3$3$3
(기){3,}|(두){3,}|(드){3,}#->#$1$1$1$2$2$2$3$3$3
(라){3,}|(르){3,}|(버){3,}#->#$1$1$1$2$2$2$3$3$3
(아){3,}|(어){3,}|(에){3,}#->#$1$1$1$2$2$2$3$3$3
(오){3,}|(우){3,}|(으){3,}#->#$1$1$1$2$2$2$3$3$3
(이){3,}|(저){3,}|(지){3,}#->#$1$1$1$2$2$2$3$3$3
(콰){3,}|(타){3,}|(터){3,}#->#$1$1$1$2$2$2$3$3$3
(투){3,}|(하){3,}|(그){3,}#->#$1$1$1$2$2$2$3$3$3
(땡){3,}|(다){3,}|(탕){3,}#->#$1$1$1$2$2$2$3$3$3
No\.#->#넘버
LV\.#->#레벨.
(\d+)[kK][gG] ?([가-힣])#->#$1킬로그램$2
(\d+)[kK][mM] ?([가-힣])#->#$1킬로미터$2
(\d+)[mM] ?([가-힣])#->#$1미터$2
(\d+)[gG] ?([가-힣])#->#$1그램$2
 [kK][mM] ?([가-힣])#->#킬로미터$1
 [mM] ?([가-힣])#->#미터$1
 

한글 뒤에 괄호없이 바로 붙어 한자가 나오는 경우 한자는 스킵

([가-힣])([一-鿕]|[㐀-䶵]|[豈-龎])+#->#$1


커뮤니티에서 쓰는 초성줄임말등 

ㄱㄱ+#->#,고고,
ㅇㅇ+#->#,응,
ㅈㄴ#->#졸라
ㅅㅂ#->#,스바,
ㄹㅇ#->#,리얼,
ㄴㄴ#->#,노노,
ㅇㅈ#->#,인정,
ㅅㄱ#->#,수고,
ㅋㅋ+#->#,크크,
ㅎㅎ+#->#,흐흐,
ㄷㄷ+#->#,덜덜,
ㅁㅊ#->#,미친,
ㅉㅉ#->#,쯔쯔,
ㄴㅈ#->#,노잼,
ㅎㄷ#->#후덜
ㅎㄷㄷ#->#,후덜덜,

 

삼성 TTS에서 분수와 분기를 자연스럽게 읽게하고 숫자사이 쉼표를 스킵해서 한덩어리로 취급하고 1마리 1명등과 같이 아리비아 숫자와 단위명사를 섞어 쓴 경우 우리말숫자 표현과 한자어 숫자 표현을 구분하게 하는 항목. 로마자 숫자를 영어식으로 읽게 하는 항목중 Ⅰ,Ⅴ는 영문자 I,V와는 구분하여 입력해야 됨.

(\d),(\d),?#->#$1$2
([1-4])/4 ?분기#->#$1사분기
([1-9])/([1-9][0-9]?[0-9]?)#->#$2분지$1
([0-9]):([0-9][0-9]?)#->#$1대$2
(\d)([가-힣])#->#$1~$2
(\d)~([개시월배명살달병대])#->#$1$2
(\d)~(마리|번째|공기|가지)#->#$1$2
(\d)(개국|개월|대대|대 )#->#$1~$2
1달[^라러]#->#한달
2달[^라러]#->#두달
3달[^라러]#->#세달
4달[^라러]#->#네달
 119 ?([가-힣])#-># 일일구$1 
 911 ?([가-힣])#-># 구일일$1
Ⅰ#->#원
Ⅱ#->#투
Ⅲ#->#쓰리
Ⅳ#->#포
Ⅴ#->#파이브

삼성 TTS의 일부 TTS음성에서 경음과 연음 버그를 피하기위해 추가한 항목.

간략#->#갈략
6월#->#유월
10월#->#시월
것이리라#->#거시리라
없어#->#업서
없었#->#업섰
권력#->#궐력
붙인#->#부친
붙이#->#부치
붙여#->#부쳐
붙어#->#부터
뱉어#->#배터
뱉었#->#배텄
짙어#->#지터
없앨#->#업샐
없애#->#업새
곤란#->#,골란
헛웃음#->#허두슴
웃음#->#우슴
폭약#->#포갹
집터#->#집 터
뒷이야기#->#뒷 이야기
 못이([기겨긴겼길])#-># 못 이$1
([볼줄])게\.#->#$1께.
짓이([겨겼])#->#진니$1
아랫입술#->#아랫 입술

 

삼성 TTS의 추가음성에서 고,지로 끝나는 말에서 음성이 길게 늘어지다가 끊기는 버그를 피하기 위한 항목. 기본음성에선 제거해야 자연스럽게 나옴.

([라받])고[\.!\?,]”?#->#$1 고,
야지[\.!\?,]”?#->#야 지,



**유니코드 영역

한글음절영역: [가-힣] or [\uAC00-\uD7AF]
한중일 통합한자영역: [一-鿕] or [\u4E00-\u9FFF]
한중일 통합한자 확장A: [㐀-䶵] or [\u3400-\u4DBF]
한중일 호환용 한자: [豈-龎] or [\uF900-\uFAFF]
일본어영역: [ぁ-ー] or [\u3041-\u30FC]

**필터을 해제한 음성을 듣고 싶다면 정규식 체크를 해제하고 비교하면 됨.  

참고 : 문리더 이름대체 필터
https://ntxlds.blogspot.com/2022/02/blog-post_26.html