真的有能复现出理想结果，不狂草的吗？作者大大还能复现出不？ #75

bye-mr-jia · 2024-03-27T00:44:38Z

      有没有大佬能正常复现出不狂草的字体的。我已经试过二值化了，我是通过夸克扫描王扫描之后，用的lssues区的一段代码二值化，还是没什么用，就是一狂到底，根本没有不狂草的例子，有没有什么解决办法，微调是微调代码还是微调输入的图片？
     小白选手，真心求学，真的想拥有一套自己的字体，假如你那边你那边能复现也行，可有偿。

The text was updated successfully, but these errors were encountered:

bye-mr-jia · 2024-04-01T13:31:53Z

Hello?有人在吗？

YZcat2023 · 2024-04-02T11:52:05Z

现在我复现了，还不错

YZcat2023 · 2024-04-02T11:53:56Z

我是sai ver.2,使用了关闭压感的数位板输入的，128x128px，宽2.7px，写了一个代码处理输入数据（二值化）,跑出来挺正

YZcat2023 · 2024-04-02T11:57:21Z

YZcat2023 · 2024-04-02T12:05:14Z

from PIL import Image  
import os  
# 设置二值化阈值  
threshold = 128  
current_dir = os.getcwd()  

for filename in os.listdir(current_dir):  
    if filename.endswith(('.jpg', '.png')):  
        img = Image.open(filename)  
        gray_img = img.convert('L')  
        binary_img = gray_img.point(lambda x: 255 if x > threshold else 0, '1')  
        binary_filename = filename.rsplit('.', 1)[0] + '_binary.' + filename.rsplit('.', 1)[1]  
        binary_img.save(binary_filename)  
          
        print(f"保存为：{binary_filename}")
        try:  
            os.remove(filename)  
            print(f"已删除：{filename}")  
        except OSError as e:  
            print(f"无法删除 {filename}.{e.strerror}")

dailenson · 2024-04-02T12:21:07Z

厉害。应该是目前为止复现结果最好的了，你关掉了压力输入这一点很重要，这样笔画就是均匀的了。

YZcat2023 · 2024-04-02T12:51:22Z

厉害。应该是目前为止复现结果最好的了，你关掉了压力输入这一点很重要，这样笔画就是均匀的了。

对了，没有英文输入怎么办，我还指望它给我写实验报告呜呜呜

YZcat2023 · 2024-04-02T12:56:01Z

英文字符自己写应该也不是不行，那样的话就只差转成svg和转成ttf了吧

YZcat2023 · 2024-04-02T14:14:23Z

https://www.bilibili.com/video/BV1ri4y1o7hj/?vd_source=16ed56ce6ce6d7c53438afb279557d9d 这个似乎是可行的转ttf方案

YZcat2023 · 2024-04-02T15:34:58Z

@dailenson 现在有一个难受的事情：potrace太老了，而且win上难用，如何转化成svg成为极大的问题，vectormagic也许是解决方案，但是这是付费软件。

YZcat2023 · 2024-04-05T14:12:18Z

补充目前使用的情况：有几个字就是写不好，比如“双”字总是会自己跑到上面去；输入数据太多（我这里是12400+3070本子）超过200个左右就好像不正常出图了，第一批64个出完就不动了，感觉90个输入左右可能是合适的

YZcat2023 · 2024-04-06T07:40:17Z

没时间研究了，我拿vectormagic办完了。然后注意，先要写个脚本把图片转成透明背景的，不然导进去就是反色的

dailenson · 2024-04-07T14:27:47Z

没时间研究了，我拿vectormagic办完了。然后注意，先要写个脚本把图片转成透明背景的，不然导进去就是反色的
把你的效果贴上来看下？

kernelwangxuan · 2024-04-11T13:21:51Z

可能 ostu 这些算法直接处理更好？
另外提一个思路：作者有没有考虑过一些类似Xiaolin Wu，或者一些 dithering 方法（Floyd Steinberg），以支持在二值化图像中类似笔画粗细和一些复杂手写字符的表示？还有一个麻烦就是连字处理，英文只用支持一些常见的连字，比如 tt，fi，ff，中文就麻烦了

bye-mr-jia · 2024-04-12T03:32:40Z

现在我复现了，还不错

你好，能加一下联系方式吗？我想深入请教你一下，这是我的邮箱bye_mr_pai@163.com

gudaoxongdi · 2024-04-16T00:12:08Z

from PIL import Image  
import os  
# 设置二值化阈值  
threshold = 128  
current_dir = os.getcwd()  

for filename in os.listdir(current_dir):  
    if filename.endswith(('.jpg', '.png')):  
        img = Image.open(filename)  
        gray_img = img.convert('L')  
        binary_img = gray_img.point(lambda x: 255 if x > threshold else 0, '1')  
        binary_filename = filename.rsplit('.', 1)[0] + '_binary.' + filename.rsplit('.', 1)[1]  
        binary_img.save(binary_filename)  
          
        print(f"保存为：{binary_filename}")
        try:  
            os.remove(filename)  
            print(f"已删除：{filename}")  
        except OSError as e:  
            print(f"无法删除 {filename}.{e.strerror}")

小白，请问一下这段代码是放在哪个py文件里面吗，具体怎么使用呢？

bianyangT · 2024-04-16T19:37:43Z

from PIL import Image  
import os  
# 设置二值化阈值  
threshold = 128  
current_dir = os.getcwd()  

for filename in os.listdir(current_dir):  
    if filename.endswith(('.jpg', '.png')):  
        img = Image.open(filename)  
        gray_img = img.convert('L')  
        binary_img = gray_img.point(lambda x: 255 if x > threshold else 0, '1')  
        binary_filename = filename.rsplit('.', 1)[0] + '_binary.' + filename.rsplit('.', 1)[1]  
        binary_img.save(binary_filename)  
          
        print(f"保存为：{binary_filename}")
        try:  
            os.remove(filename)  
            print(f"已删除：{filename}")  
        except OSError as e:  
            print(f"无法删除 {filename}.{e.strerror}")

小白，请问一下这段代码是放在哪个py文件里面吗，具体怎么使用呢？

编辑成单独的.py文件，放在要处理的图片的目录下面，运行就可以了

YZcat2023 · 2024-04-28T15:20:56Z

没时间研究了，我拿vectormagic办完了。然后注意，先要写个脚本把图片转成透明背景的，不然导进去就是反色的
把你的效果贴上来看下？

好的

YZcat2023 · 2024-04-28T15:24:27Z

现在我复现了，还不错

你好，能加一下联系方式吗？我想深入请教你一下，这是我的邮箱bye_mr_pai@163.com

yzkitten2023@gmail.com

YZcat2023 · 2024-04-28T15:25:08Z

或者Qq2803839524

coling0 · 2024-05-15T14:15:38Z

用window自带的画图板写了30个字，跑出来效果还能可以

这个是用扫描仪扫描的40个手写，用#62 的代码切割出来的，一般环境倒也能接受，目前正在寻找标点符号的解决办法

aceliuchanghong · 2024-05-26T03:45:17Z

我是sai ver.2,使用了关闭压感的数位板输入的，128x128px，宽2.7px，写了一个代码处理输入数据（二值化）,跑出来挺正

大佬,有没有你的style_samples可以发个压缩包吗,我想看看到底哪儿有问题,我的

gudaoxongdi · 2024-05-30T08:07:42Z

简单说一下规律，这个模型对笔画的宽度有着十分严格的限制，只要笔画宽了，就容易出“草书” 解决方法和楼主说的一样，笔宽12，画面100% 我是拿鼠标画的，就调整成，笔宽6，画面50%，这样就方便画一点

确实，跟画笔的粗细关系很大。

第1张是按照说明，在sai里用二值笔，关闭压感，粗细为12，结果生成的还是很潦草的。

第2张，其它条件一样，就是把粗细调成3，生成的就不怎么潦草了。

第3张是在AI里，用相对细的线条写的，生成的也不怎么潦草了。

yicone · 2024-06-12T03:05:09Z

感谢 @YZcat2023 分享经验。

也分享一张生成结果。效果没有那么好，但也不算飞线飞得太厉害。

图中上半部分是二值化处理后的图片。

笔画的线条可能还是偏粗，不确定是不是这个因素，导致推理结果还是往草书的方向去演化了？ @dailenson

另外，私人化的一些步骤是：

手写是在iPad上用 Notes 和 Apple Pencil(一代) 完成的，屏幕上选第3种笔，因为它的笔画粗细一致，不受压感影响；设置网格背景，选较大的那个方格。
在iPad上截屏，然后沿着网格线裁剪，只保留包含文字的整片区域。
在电脑上，用代码将第2步产生的单张图片，一次性切分为每个字一张图片。

from PIL import Image
# import pytesseract
# from pypinyin import lazy_pinyin
import os


def split_images_by_word(image_path: str, output_dir: str):
    # 加载图像
    img = Image.open(image_path)

    # 假设图像已经按网格对齐，并且网格大小相同
    num_rows = 5  # 图中汉字行数
    num_cols = 9  # 图中汉字列数
    grid_width, grid_height = 161, 161

    # 创建输出目录
    os.makedirs(output_dir, exist_ok=True)

    for row in range(num_rows):
        for col in range(num_cols):
            # 裁剪图像
            left = col * grid_width
            top = row * grid_height
            right = left + grid_width
            bottom = top + grid_height
            cropped_img = img.crop((left, top, right, bottom))

            # 使用 OCR 识别图像中的汉字
            # character = pytesseract.image_to_string(cropped_img, lang='chi_sim', config='--psm 10')

            # 转换汉字到拼音
            # pinyin = ''.join(lazy_pinyin(character))
            # print([row, col], pinyin)

            filename = f"{row}{col}.png"

            # 保存图像
            cropped_img.save(os.path.join(output_dir, filename))

    print("图像处理完成")

dailenson · 2024-06-12T08:01:36Z

感谢 @YZcat2023 分享经验。

也分享一张生成结果。效果没有那么好，但也不算飞线飞得太厉害。

图中上半部分是二值化处理后的图片。

笔画的线条可能还是偏粗，不确定是不是这个因素，导致推理结果还是往草书的方向去演化了？ @dailenson

另外，私人化的一些步骤是：

手写是在iPad上用 Notes 和 Apple Pencil(一代) 完成的，屏幕上选第3种笔，因为它的笔画粗细一致，不受压感影响；设置网格背景，选较大的那个方格。
在iPad上截屏，然后沿着网格线裁剪，只保留包含文字的整片区域。
在电脑上，用代码将第2步产生的单张图片，一次性切分为每个字一张图片。

from PIL import Image
# import pytesseract
# from pypinyin import lazy_pinyin
import os


def split_images_by_word(image_path: str, output_dir: str):
    # 加载图像
    img = Image.open(image_path)

    # 假设图像已经按网格对齐，并且网格大小相同
    num_rows = 5  # 图中汉字行数
    num_cols = 9  # 图中汉字列数
    grid_width, grid_height = 161, 161

    # 创建输出目录
    os.makedirs(output_dir, exist_ok=True)

    for row in range(num_rows):
        for col in range(num_cols):
            # 裁剪图像
            left = col * grid_width
            top = row * grid_height
            right = left + grid_width
            bottom = top + grid_height
            cropped_img = img.crop((left, top, right, bottom))

            # 使用 OCR 识别图像中的汉字
            # character = pytesseract.image_to_string(cropped_img, lang='chi_sim', config='--psm 10')

            # 转换汉字到拼音
            # pinyin = ''.join(lazy_pinyin(character))
            # print([row, col], pinyin)

            filename = f"{row}{col}.png"

            # 保存图像
            cropped_img.save(os.path.join(output_dir, filename))

    print("图像处理完成")

笔粗应该是对模型性能有影响的，可以试试不同笔粗的效果。另外，iPad用户可以跟这位童鞋交流一下，他目前用iPad可以得到满意的结果。

yicone · 2024-06-13T09:19:43Z

针对个人之前的实验方式，做了些改进。

取消了二值化处理，之前用只是为了去除网格线，但二值化处理会导致文字线条不平滑。

现在改为在裁剪图片前，提供同一组字的有网格和无网格背景的两张图片，先对有网格的选取截图区域，然后再用同样的截图区域，从无网格的图片中截取包含文字的部分。

如此处理后，生成的文字，草书现象基本可以忽略了。

但新问题是，输出与输入相比，真的很不像！特此请教两位，是哪个环节的问题呢，该如何优化？ @dailenson @YZcat2023

上方是输入，下方是输出。

制作为字体后的输出效果。

dailenson · 2024-07-17T11:32:14Z

针对个人之前的实验方式，做了些改进。

取消了二值化处理，之前用只是为了去除网格线，但二值化处理会导致文字线条不平滑。

现在改为在裁剪图片前，提供同一组字的有网格和无网格背景的两张图片，先对有网格的选取截图区域，然后再用同样的截图区域，从无网格的图片中截取包含文字的部分。

如此处理后，生成的文字，草书现象基本可以忽略了。

但新问题是，输出与输入相比，真的很不像！特此请教两位，是哪个环节的问题呢，该如何优化？ @dailenson @YZcat2023

上方是输入，下方是输出。

制作为字体后的输出效果。

我感觉可能是笔画宽度的问题。

yicone · 2024-07-24T02:35:03Z

针对个人之前的实验方式，做了些改进。
取消了二值化处理，之前用只是为了去除网格线，但二值化处理会导致文字线条不平滑。
现在改为在裁剪图片前，提供同一组字的有网格和无网格背景的两张图片，先对有网格的选取截图区域，然后再用同样的截图区域，从无网格的图片中截取包含文字的部分。
如此处理后，生成的文字，草书现象基本可以忽略了。
但新问题是，输出与输入相比，真的很不像！特此请教两位，是哪个环节的问题呢，该如何优化？ @dailenson @YZcat2023
上方是输入，下方是输出。
制作为字体后的输出效果。

我感觉可能是笔画宽度的问题。

感谢回复。

笔画宽度已经是均匀的了
#78 (comment)

dailenson · 2024-07-24T04:27:30Z

针对个人之前的实验方式，做了些改进。
取消了二值化处理，之前用只是为了去除网格线，但二值化处理会导致文字线条不平滑。
现在改为在裁剪图片前，提供同一组字的有网格和无网格背景的两张图片，先对有网格的选取截图区域，然后再用同样的截图区域，从无网格的图片中截取包含文字的部分。
如此处理后，生成的文字，草书现象基本可以忽略了。
但新问题是，输出与输入相比，真的很不像！特此请教两位，是哪个环节的问题呢，该如何优化？ @dailenson @YZcat2023
上方是输入，下方是输出。
制作为字体后的输出效果。

我感觉可能是笔画宽度的问题。

感谢回复。

笔画宽度已经是均匀的了 #78 (comment)

宽度的要求有两方面，一方面是均匀，另一方面不能太细或者太粗，我感觉你输入的参考样本太细了。还有就是参考样本的笔画颜色要求是纯黑的。

ChenxingZhang · 2024-08-03T05:00:42Z

那完了呀，我还想生成我的手写体。纸面手写体和数位板差距还蛮大的，二值化处理之后我的手写体还是不能正常生成。

yicone mentioned this issue Jun 17, 2024

教程：从手写字体到A4纸打印（GPU篇） #78

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

真的有能复现出理想结果，不狂草的吗？作者大大还能复现出不？ #75

真的有能复现出理想结果，不狂草的吗？作者大大还能复现出不？ #75

bye-mr-jia commented Mar 27, 2024

bye-mr-jia commented Apr 1, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

dailenson commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 5, 2024

YZcat2023 commented Apr 6, 2024

dailenson commented Apr 7, 2024

kernelwangxuan commented Apr 11, 2024 •

edited

Loading

bye-mr-jia commented Apr 12, 2024

gudaoxongdi commented Apr 16, 2024 •

edited

Loading

bianyangT commented Apr 16, 2024

YZcat2023 commented Apr 28, 2024

YZcat2023 commented Apr 28, 2024

YZcat2023 commented Apr 28, 2024

coling0 commented May 15, 2024

aceliuchanghong commented May 26, 2024

gudaoxongdi commented May 30, 2024

yicone commented Jun 12, 2024 •

edited

Loading

dailenson commented Jun 12, 2024 •

edited

Loading

yicone commented Jun 13, 2024 •

edited

Loading

dailenson commented Jul 17, 2024

yicone commented Jul 24, 2024

dailenson commented Jul 24, 2024 •

edited

Loading

ChenxingZhang commented Aug 3, 2024

真的有能复现出理想结果，不狂草的吗？作者大大还能复现出不？ #75

真的有能复现出理想结果，不狂草的吗？作者大大还能复现出不？ #75

Comments

bye-mr-jia commented Mar 27, 2024

bye-mr-jia commented Apr 1, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

dailenson commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 2, 2024

YZcat2023 commented Apr 5, 2024

YZcat2023 commented Apr 6, 2024

dailenson commented Apr 7, 2024

kernelwangxuan commented Apr 11, 2024 • edited Loading

bye-mr-jia commented Apr 12, 2024

gudaoxongdi commented Apr 16, 2024 • edited Loading

bianyangT commented Apr 16, 2024

YZcat2023 commented Apr 28, 2024

YZcat2023 commented Apr 28, 2024

YZcat2023 commented Apr 28, 2024

coling0 commented May 15, 2024

aceliuchanghong commented May 26, 2024

gudaoxongdi commented May 30, 2024

yicone commented Jun 12, 2024 • edited Loading

dailenson commented Jun 12, 2024 • edited Loading

yicone commented Jun 13, 2024 • edited Loading

dailenson commented Jul 17, 2024

yicone commented Jul 24, 2024

dailenson commented Jul 24, 2024 • edited Loading

ChenxingZhang commented Aug 3, 2024

kernelwangxuan commented Apr 11, 2024 •

edited

Loading

gudaoxongdi commented Apr 16, 2024 •

edited

Loading

yicone commented Jun 12, 2024 •

edited

Loading

dailenson commented Jun 12, 2024 •

edited

Loading

yicone commented Jun 13, 2024 •

edited

Loading

dailenson commented Jul 24, 2024 •

edited

Loading