위치는 기타설정/TTS 설정/TTS 문자 필터
아래설정은 괄호안의 한자, 일본어, 영문등은 스킵하고 길게 늘어지는 의성어는 짧게 줄임.
말줄임표와 쉼표는 마침표로 치환하고 #, *은 스킵 또는 하나로 줄이고 몇몇 기호문자는 스킵.
아래 내용을 확장자는 .ttsfilter로 이름은 현재 불러들인 텍스트이름으로 저장하고 TTS문자필터에서 불러오기. 또는 이름을 임의로 정하고 경로명을 정확히 입력하고 불러오기.
필요한 부분만 쓴다면 #->#은 제외하고 하나씩 입력해도 됨.
한자와 영문등 많은 부분에 정규표현식을 사용했으니 필터에 정규식사용에 체크.
[—ㅡ_]|[ㅠㅜ]|ㅂㅅ|-$|\[|\.?\]#->#[♥♣♠◀▶★♩♪♫♬]#->#;|……?\.?#->#,([\.\* ?]){2,}#->#$1- ?(\D)#->#$1(?m)^#\d+화?.*#->#*\(([一-鿕]|[㐀-䶵]|[豈-龎]).*?\)#->#\([a-zA-Z].*?\)#->#\([ぁ-ー].*?\)#->#(가){3,}|(과){3,}|(구){3,}#->#$1$1$1$2$2$2$3$3$3(기){3,}|(두){3,}|(드){3,}#->#$1$1$1$2$2$2$3$3$3(라){3,}|(르){3,}|(버){3,}#->#$1$1$1$2$2$2$3$3$3(아){3,}|(어){3,}|(에){3,}#->#$1$1$1$2$2$2$3$3$3(오){3,}|(우){3,}|(으){3,}#->#$1$1$1$2$2$2$3$3$3(이){3,}|(저){3,}|(지){3,}#->#$1$1$1$2$2$2$3$3$3(콰){3,}|(타){3,}|(터){3,}#->#$1$1$1$2$2$2$3$3$3(투){3,}|(하){3,}|(그){3,}#->#$1$1$1$2$2$2$3$3$3(땡){3,}|(다){3,}|(탕){3,}#->#$1$1$1$2$2$2$3$3$3No\.#->#넘버LV\.#->#레벨.(\d+)[kK][gG] ?([가-힣])#->#$1킬로그램$2(\d+)[kK][mM] ?([가-힣])#->#$1킬로미터$2(\d+)[mM] ?([가-힣])#->#$1미터$2(\d+)[gG] ?([가-힣])#->#$1그램$2[kK][mM] ?([가-힣])#->#킬로미터$1[mM] ?([가-힣])#->#미터$1
한글 뒤에 괄호없이 바로 붙어 한자가 나오는 경우 한자는 스킵
([가-힣])([一-鿕]|[㐀-䶵]|[豈-龎])+#->#$1
커뮤니티에서 쓰는 초성줄임말등
ㄱㄱ+#->#,고고,ㅇㅇ+#->#,응,ㅈㄴ#->#졸라ㅅㅂ#->#,스바,ㄹㅇ#->#,리얼,ㄴㄴ#->#,노노,ㅇㅈ#->#,인정,ㅅㄱ#->#,수고,ㅋㅋ+#->#,크크,ㅎㅎ+#->#,흐흐,ㄷㄷ+#->#,덜덜,ㅁㅊ#->#,미친,ㅉㅉ#->#,쯔쯔,ㄴㅈ#->#,노잼,ㅎㄷ#->#후덜ㅎㄷㄷ#->#,후덜덜,
삼성 TTS에서 분수와 분기를 자연스럽게 읽게하고 숫자사이 쉼표를 스킵해서 한덩어리로 취급하고 1마리 1명등과 같이 아리비아 숫자와 단위명사를 섞어 쓴 경우 우리말숫자 표현과 한자어 숫자 표현을 구분하게 하는 항목. 로마자 숫자를 영어식으로 읽게 하는 항목중 Ⅰ,Ⅴ는 영문자 I,V와는 구분하여 입력해야 됨.
(\d),(\d),?#->#$1$2([1-4])/4 ?분기#->#$1사분기([1-9])/([1-9][0-9]?[0-9]?)#->#$2분지$1([0-9]):([0-9][0-9]?)#->#$1대$2(\d)([가-힣])#->#$1~$2(\d)~([개시월배명살달병대])#->#$1$2(\d)~(마리|번째|공기|가지)#->#$1$2(\d)(개국|개월|대대|대 )#->#$1~$21달[^라러]#->#한달2달[^라러]#->#두달3달[^라러]#->#세달4달[^라러]#->#네달119 ?([가-힣])#-># 일일구$1911 ?([가-힣])#-># 구일일$1Ⅰ#->#원Ⅱ#->#투Ⅲ#->#쓰리Ⅳ#->#포Ⅴ#->#파이브
삼성 TTS의 일부 TTS음성에서 경음과 연음 버그를 피하기위해 추가한 항목.
간략#->#갈략6월#->#유월10월#->#시월것이리라#->#거시리라없어#->#업서없었#->#업섰권력#->#궐력붙인#->#부친붙이#->#부치붙여#->#부쳐붙어#->#부터뱉어#->#배터뱉었#->#배텄짙어#->#지터없앨#->#업샐없애#->#업새곤란#->#,골란헛웃음#->#허두슴웃음#->#우슴폭약#->#포갹집터#->#집 터뒷이야기#->#뒷 이야기못이([기겨긴겼길])#-># 못 이$1([볼줄])게\.#->#$1께.짓이([겨겼])#->#진니$1아랫입술#->#아랫 입술
삼성 TTS의 추가음성에서 고,지로 끝나는 말에서 음성이 길게 늘어지다가 끊기는 버그를 피하기 위한 항목. 기본음성에선 제거해야 자연스럽게 나옴.
([라받])고[\.!\?,]”?#->#$1 고,야지[\.!\?,]”?#->#야 지,
2024.11 이후 추가된 것들
** 모의, 주의, 악의 등 '의'발음이 '에'발음으로 치환되는 것을 이어지는 단어와 붙여 '의'발음이 되도록 추가. (따로 추가하고 싶다면 '모주상악' 사이에 한 낱말 입력)
** 같은 음으로 세번이상 반복되는 의성어를 삭제하고 전체 한글 음절로 확장하여 같은음 세번이상 반복되면 두음절로 치환.
** 연음 버그 단어들 추가.
** ',",] 다음 바로 한글이 이어 나올 때 '',"",[]로 묶여 있는 단어를 끊어 읽지 않고 자연스럽게 읽게 하는 항목. (취향차이라 필요하지 않으면 삭제)
** 3~4개월, 3~4주 등에서 '~'를 ','로 치환. '에서'로 말하는 것을 한 템포 끊는 것으로 바꿈.
([모주상악]의) #->#$1([가-힣])\1{2,}#->#$1$1(알겠|없)어#->#$1써(알겠|없)으#->#$1쓰([붙뱉짙])어#->#$1터([붙뱉짙])었#->#$1텄([붙끝])이#-># $1치([것곳뜻])이#-># $1시([것곳뜻])일#-># $1실
['"\[\]](.*?)["'\[\]]([가-힣])#->#$1$2
(\d+)~(\d+)([가-힣])#->#$1,$2$3
**유니코드 영역
한글음절영역: [가-힣] or [\uAC00-\uD7AF]한중일 통합한자영역: [一-鿕] or [\u4E00-\u9FFF]한중일 통합한자 확장A: [㐀-䶵] or [\u3400-\u4DBF]한중일 호환용 한자: [豈-龎] or [\uF900-\uFAFF]일본어영역: [ぁ-ー] or [\u3041-\u30FC]
**필터를 해제한 음성을 듣고 싶다면 정규식 체크를 해제하고 비교하면 됨.
참고 : 문리더 이름대체 필터
https://ntxlds.blogspot.com/2022/02/blog-post_26.html