我也来晒晒图像二值化程序
小俊2009/07/28软件综合 IP:香港


用的是破93的RGB2L,不过偶是用CUDA写的:


#define THREAD_N    256
#define THRESHOLD    127

__global__ static void binarizeKernel(unsigned char *in, unsigned char *out)
{
    const unsigned long offset = (blockIdx.x * THREAD_N + threadIdx.x);
    unsigned char b = in[offset * 3];
    unsigned char g = in[offset * 3 + 1];
    unsigned char r = in[offset * 3 + 2];

    unsigned char mi = __min(r, __min(g, b));
    unsigned char ma = __max(r, __max(g, b));

    if(((unsigned short)ma + (unsigned short)mi) > THRESHOLD * 2)
        out[offset] = 255;
    else
        out[offset] = 0;
}

extern "C" float binarizeCall(unsigned char *in, unsigned char *out, int w, int h)
{
    unsigned char *device_src = 0;
    unsigned char *device_dest = 0;

    cudaMalloc((void **)&device_src, w * h * 3);
    cudaMalloc((void **)&device_dest, w * h);

    unsigned int timer = 0;
    cutCreateTimer(&timer);

    cudaMemcpy(device_src, in, w * h * 3, cudaMemcpyHostToDevice);

    cutStartTimer(timer);

    binarizeKernel<<<w * h / THREAD_N, THREAD_N>>>(device_src, device_dest);
    cudaThreadSynchronize();

    cutStopTimer(timer);

    cudaMemcpy(out, device_dest, w * h, cudaMemcpyDeviceToHost);

    float ms = cutGetTimerValue(timer);
    cutDeleteTimer(timer);

    cudaFree(device_dest);
    cudaFree(device_src);

    return ms;
}


来自:计算机科学 / 软件综合
5
已屏蔽 原因:{{ notice.reason }}已屏蔽
{{notice.noticeContent}}
~~空空如也
小俊 作者
15年6个月前 IP:未同步
132796


初学CUDA练练手用的。。。

找了张3264×2448的BMP,在Quadro FX5800(GT200核心)上跑花了1.73ms,在Geforce 9400M上跑花了74.2ms。

CPU实现的方法(用下面的代码VS2005编译),同样大小的图像在QX6600(2.4GHz)上花了42.6ms。


    for(y = 0; y < h; y ++)
        for(x = 0; x < w; x ++)
        {
            unsigned long offset = y * WIDTH + x;

            b = in[offset * 3];
            g = in[offset * 3 + 1];
            r = in[offset * 3 + 2];
            mi = min(r, min(g, b));
            ma = max(r, max(g, b));

            if(((unsigned short)ma + (unsigned short)mi) > THRESHOLD * 2)
                out[offset] = 255;
            else
                out[offset] = 0;
        }


引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
93°
15年6个月前 IP:未同步
132798
喷血 CUDA就是变态
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
93°
15年6个月前 IP:未同步
132800
我去写个内存法……
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
小俊作者
15年6个月前 IP:未同步
132802
引用第2楼破93于2009-07-28 16:57发表的  :
喷血 CUDA就是变态                                            


CUDA是BT,可也得卡好,至少得卡王级别的,像9400M这种主流低端配置就没啥意思了。

另外很囧的一点就是,把原始数据通过PCI-E copy到显存以及把结果从显存copy回来一共花了将近20ms。
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论

想参与大家的讨论?现在就 登录 或者 注册

所属专业
上级专业
同级专业
小俊
进士 学者 机友 笔友
文章
71
回复
1156
学术分
47
2006/12/29注册,2个月3天前活动
暂无简介
主体类型:个人
所属领域:无
认证方式:手机号
IP归属地:未同步
文件下载
加载中...
{{errorInfo}}
{{downloadWarning}}
你在 {{downloadTime}} 下载过当前文件。
文件名称:{{resource.defaultFile.name}}
下载次数:{{resource.hits}}
上传用户:{{uploader.username}}
所需积分:{{costScores}},{{holdScores}}下载当前附件免费{{description}}
积分不足,去充值
文件已丢失

当前账号的附件下载数量限制如下:
时段 个数
{{f.startingTime}}点 - {{f.endTime}}点 {{f.fileCount}}
视频暂不能访问,请登录试试
仅供内部学术交流或培训使用,请先保存到本地。本内容不代表科创观点,未经原作者同意,请勿转载。
音频暂不能访问,请登录试试
支持的图片格式:jpg, jpeg, png
插入公式
评论控制
加载中...
文号:{{pid}}
投诉或举报
加载中...
{{tip}}
请选择违规类型:
{{reason.type}}

空空如也

加载中...
详情
详情
推送到专栏从专栏移除
设为匿名取消匿名
查看作者
回复
只看作者
加入收藏取消收藏
收藏
取消收藏
折叠回复
置顶取消置顶
评学术分
鼓励
设为精选取消精选
管理提醒
编辑
通过审核
评论控制
退修或删除
历史版本
违规记录
投诉或举报
加入黑名单移除黑名单
查看IP
{{format('YYYY/MM/DD HH:mm:ss', toc)}}