//
// Generated by NVIDIA NVVM Compiler
// Compiler built on Wed Jul 10 12:41:20 2013 (1373485280)
// Cuda compilation tools, release 5.5, V5.5.0
//

.version 3.2
.target sm_30
.address_size 64

	.file	1 "D:/singlebarrel/releases/2014.03/shared/adobe/Iridas/IRIDASLIB/GPU/fxKuwaharaFilter5x5.cu", 1399785249, 7987
	.file	2 "d:\\singlebarrel\\releases\\2014.03\\shared\\adobe\\mediacore\\external\\3rdparty\\nvidia\\cuda\\win\\include\\device_functions.h", 1399785281, 191626
.global .texref texture0_RECT;
.global .align 1 .b8 $str[11] = {95, 95, 67, 85, 68, 65, 95, 70, 84, 90, 0};

.visible .entry ShaderKernel_fxKuwaharaFilter5x5(
	.param .u64 ShaderKernel_fxKuwaharaFilter5x5_param_0,
	.param .u32 ShaderKernel_fxKuwaharaFilter5x5_param_1,
	.param .u32 ShaderKernel_fxKuwaharaFilter5x5_param_2,
	.param .u32 ShaderKernel_fxKuwaharaFilter5x5_param_3,
	.param .u32 ShaderKernel_fxKuwaharaFilter5x5_param_4,
	.param .u64 ShaderKernel_fxKuwaharaFilter5x5_param_5,
	.param .u64 ShaderKernel_fxKuwaharaFilter5x5_param_6
)
{
	.reg .pred 	%p<8>;
	.reg .s16 	%rs<5>;
	.reg .s32 	%r<14>;
	.reg .f32 	%f<589>;
	.reg .s64 	%rd<79>;


	ld.param.u64 	%rd2, [ShaderKernel_fxKuwaharaFilter5x5_param_0];
	ld.param.u32 	%r4, [ShaderKernel_fxKuwaharaFilter5x5_param_1];
	ld.param.u32 	%r5, [ShaderKernel_fxKuwaharaFilter5x5_param_2];
	ld.param.u32 	%r6, [ShaderKernel_fxKuwaharaFilter5x5_param_3];
	ld.param.u32 	%r7, [ShaderKernel_fxKuwaharaFilter5x5_param_4];
	cvta.to.global.u64 	%rd1, %rd2;
	.loc 1 24 1
	mov.u32 	%r8, %ntid.x;
	mov.u32 	%r9, %ctaid.x;
	mov.u32 	%r10, %tid.x;
	mad.lo.s32 	%r1, %r8, %r9, %r10;
	mov.u32 	%r11, %ntid.y;
	mov.u32 	%r12, %ctaid.y;
	mov.u32 	%r13, %tid.y;
	mad.lo.s32 	%r2, %r11, %r12, %r13;
	.loc 1 24 1
	setp.lt.s32	%p1, %r1, %r6;
	setp.lt.s32	%p2, %r2, %r7;
	and.pred  	%p3, %p1, %p2;
	.loc 1 24 1
	@!%p3 bra 	BB0_4;
	bra.uni 	BB0_1;

BB0_1:
	.loc 1 24 1
	cvt.rn.f32.s32	%f225, %r1;
	add.ftz.f32 	%f187, %f225, 0f3F000000;
	cvt.rn.f32.s32	%f226, %r2;
	add.ftz.f32 	%f188, %f226, 0f3F000000;
	.loc 1 24 1
	add.ftz.f32 	%f169, %f187, 0f40000000;
	add.ftz.f32 	%f80, %f188, 0f40000000;
	add.ftz.f32 	%f223, %f187, 0f00000000;
	add.ftz.f32 	%f98, %f188, 0f3F800000;
	mov.f32 	%f227, 0f3F800000;
	.loc 1 24 1
	add.ftz.f32 	%f217, %f187, 0fBF800000;
	add.ftz.f32 	%f182, %f188, 0f00000000;
	.loc 1 24 1
	add.ftz.f32 	%f206, %f188, 0fBF800000;
	.loc 1 24 1
	add.ftz.f32 	%f163, %f187, 0f3F800000;
	.loc 1 24 1
	add.ftz.f32 	%f211, %f187, 0fC0000000;
	.loc 1 24 1
	add.ftz.f32 	%f224, %f188, 0fC0000000;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f9, %f10, %f11, %f12}, [texture0_RECT, {%f211, %f80}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f15, %f16, %f17, %f18}, [texture0_RECT, {%f217, %f80}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f228, %f17, %f11;
	add.ftz.f32 	%f229, %f16, %f10;
	add.ftz.f32 	%f230, %f15, %f9;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f21, %f22, %f23, %f24}, [texture0_RECT, {%f223, %f80}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f231, %f23, %f228;
	add.ftz.f32 	%f232, %f22, %f229;
	add.ftz.f32 	%f233, %f21, %f230;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f27, %f28, %f29, %f30}, [texture0_RECT, {%f211, %f98}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f234, %f29, %f231;
	add.ftz.f32 	%f235, %f28, %f232;
	add.ftz.f32 	%f236, %f27, %f233;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f33, %f34, %f35, %f36}, [texture0_RECT, {%f217, %f98}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f237, %f35, %f234;
	add.ftz.f32 	%f238, %f34, %f235;
	add.ftz.f32 	%f239, %f33, %f236;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f39, %f40, %f41, %f42}, [texture0_RECT, {%f223, %f98}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f240, %f41, %f237;
	add.ftz.f32 	%f241, %f40, %f238;
	add.ftz.f32 	%f242, %f39, %f239;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f45, %f46, %f47, %f48}, [texture0_RECT, {%f211, %f182}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f243, %f47, %f240;
	add.ftz.f32 	%f244, %f46, %f241;
	add.ftz.f32 	%f245, %f45, %f242;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f51, %f52, %f53, %f54}, [texture0_RECT, {%f217, %f182}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f246, %f53, %f243;
	add.ftz.f32 	%f247, %f52, %f244;
	add.ftz.f32 	%f248, %f51, %f245;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f57, %f58, %f59, %f60}, [texture0_RECT, {%f187, %f188}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f249, %f59, %f246;
	add.ftz.f32 	%f250, %f58, %f247;
	add.ftz.f32 	%f251, %f57, %f248;
	.loc 1 24 1
	mul.ftz.f32 	%f252, %f249, 0f3DE38E39;
	mul.ftz.f32 	%f253, %f250, 0f3DE38E39;
	mul.ftz.f32 	%f254, %f251, 0f3DE38E39;
	.loc 1 24 1
	sub.ftz.f32 	%f255, %f252, %f11;
	sub.ftz.f32 	%f256, %f253, %f10;
	sub.ftz.f32 	%f257, %f254, %f9;
	.loc 1 24 1
	mul.ftz.f32 	%f258, %f255, %f255;
	mul.ftz.f32 	%f259, %f256, %f256;
	mul.ftz.f32 	%f260, %f257, %f257;
	.loc 1 24 1
	sub.ftz.f32 	%f261, %f252, %f17;
	sub.ftz.f32 	%f262, %f253, %f16;
	sub.ftz.f32 	%f263, %f254, %f15;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f264, %f261, %f261, %f258;
	fma.rn.ftz.f32 	%f265, %f262, %f262, %f259;
	fma.rn.ftz.f32 	%f266, %f263, %f263, %f260;
	.loc 1 24 1
	sub.ftz.f32 	%f267, %f252, %f23;
	sub.ftz.f32 	%f268, %f253, %f22;
	sub.ftz.f32 	%f269, %f254, %f21;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f270, %f267, %f267, %f264;
	fma.rn.ftz.f32 	%f271, %f268, %f268, %f265;
	fma.rn.ftz.f32 	%f272, %f269, %f269, %f266;
	.loc 1 24 1
	sub.ftz.f32 	%f273, %f252, %f29;
	sub.ftz.f32 	%f274, %f253, %f28;
	sub.ftz.f32 	%f275, %f254, %f27;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f276, %f273, %f273, %f270;
	fma.rn.ftz.f32 	%f277, %f274, %f274, %f271;
	fma.rn.ftz.f32 	%f278, %f275, %f275, %f272;
	.loc 1 24 1
	sub.ftz.f32 	%f279, %f252, %f35;
	sub.ftz.f32 	%f280, %f253, %f34;
	sub.ftz.f32 	%f281, %f254, %f33;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f282, %f279, %f279, %f276;
	fma.rn.ftz.f32 	%f283, %f280, %f280, %f277;
	fma.rn.ftz.f32 	%f284, %f281, %f281, %f278;
	.loc 1 24 1
	sub.ftz.f32 	%f285, %f252, %f41;
	sub.ftz.f32 	%f286, %f253, %f40;
	sub.ftz.f32 	%f287, %f254, %f39;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f288, %f285, %f285, %f282;
	fma.rn.ftz.f32 	%f289, %f286, %f286, %f283;
	fma.rn.ftz.f32 	%f290, %f287, %f287, %f284;
	.loc 1 24 1
	sub.ftz.f32 	%f291, %f252, %f47;
	sub.ftz.f32 	%f292, %f253, %f46;
	sub.ftz.f32 	%f293, %f254, %f45;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f294, %f291, %f291, %f288;
	fma.rn.ftz.f32 	%f295, %f292, %f292, %f289;
	fma.rn.ftz.f32 	%f296, %f293, %f293, %f290;
	.loc 1 24 1
	sub.ftz.f32 	%f297, %f252, %f53;
	sub.ftz.f32 	%f298, %f253, %f52;
	sub.ftz.f32 	%f299, %f254, %f51;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f300, %f297, %f297, %f294;
	fma.rn.ftz.f32 	%f301, %f298, %f298, %f295;
	fma.rn.ftz.f32 	%f302, %f299, %f299, %f296;
	.loc 1 24 1
	sub.ftz.f32 	%f303, %f252, %f59;
	sub.ftz.f32 	%f304, %f253, %f58;
	sub.ftz.f32 	%f305, %f254, %f57;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f306, %f303, %f303, %f300;
	fma.rn.ftz.f32 	%f307, %f304, %f304, %f301;
	fma.rn.ftz.f32 	%f308, %f305, %f305, %f302;
	.loc 1 24 1
	mul.ftz.f32 	%f309, %f307, 0f3DE38E39;
	fma.rn.ftz.f32 	%f310, %f306, 0f3DE38E39, %f309;
	fma.rn.ftz.f32 	%f311, %f308, 0f3DE38E39, %f310;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f63, %f64, %f65, %f66}, [texture0_RECT, {%f223, %f80}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f69, %f70, %f71, %f72}, [texture0_RECT, {%f163, %f80}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f312, %f71, %f65;
	add.ftz.f32 	%f313, %f70, %f64;
	add.ftz.f32 	%f314, %f69, %f63;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f75, %f76, %f77, %f78}, [texture0_RECT, {%f169, %f80}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f315, %f77, %f312;
	add.ftz.f32 	%f316, %f76, %f313;
	add.ftz.f32 	%f317, %f75, %f314;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f81, %f82, %f83, %f84}, [texture0_RECT, {%f223, %f98}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f318, %f83, %f315;
	add.ftz.f32 	%f319, %f82, %f316;
	add.ftz.f32 	%f320, %f81, %f317;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f87, %f88, %f89, %f90}, [texture0_RECT, {%f163, %f98}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f321, %f89, %f318;
	add.ftz.f32 	%f322, %f88, %f319;
	add.ftz.f32 	%f323, %f87, %f320;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f93, %f94, %f95, %f96}, [texture0_RECT, {%f169, %f98}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f324, %f95, %f321;
	add.ftz.f32 	%f325, %f94, %f322;
	add.ftz.f32 	%f326, %f93, %f323;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f99, %f100, %f101, %f102}, [texture0_RECT, {%f187, %f188}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f327, %f101, %f324;
	add.ftz.f32 	%f328, %f100, %f325;
	add.ftz.f32 	%f329, %f99, %f326;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f105, %f106, %f107, %f108}, [texture0_RECT, {%f163, %f182}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f330, %f107, %f327;
	add.ftz.f32 	%f331, %f106, %f328;
	add.ftz.f32 	%f332, %f105, %f329;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f111, %f112, %f113, %f114}, [texture0_RECT, {%f169, %f182}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f333, %f113, %f330;
	add.ftz.f32 	%f334, %f112, %f331;
	add.ftz.f32 	%f335, %f111, %f332;
	.loc 1 24 1
	mul.ftz.f32 	%f336, %f333, 0f3DE38E39;
	mul.ftz.f32 	%f337, %f334, 0f3DE38E39;
	mul.ftz.f32 	%f338, %f335, 0f3DE38E39;
	.loc 1 24 1
	sub.ftz.f32 	%f339, %f336, %f65;
	sub.ftz.f32 	%f340, %f337, %f64;
	sub.ftz.f32 	%f341, %f338, %f63;
	.loc 1 24 1
	mul.ftz.f32 	%f342, %f339, %f339;
	mul.ftz.f32 	%f343, %f340, %f340;
	mul.ftz.f32 	%f344, %f341, %f341;
	.loc 1 24 1
	sub.ftz.f32 	%f345, %f336, %f71;
	sub.ftz.f32 	%f346, %f337, %f70;
	sub.ftz.f32 	%f347, %f338, %f69;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f348, %f345, %f345, %f342;
	fma.rn.ftz.f32 	%f349, %f346, %f346, %f343;
	fma.rn.ftz.f32 	%f350, %f347, %f347, %f344;
	.loc 1 24 1
	sub.ftz.f32 	%f351, %f336, %f77;
	sub.ftz.f32 	%f352, %f337, %f76;
	sub.ftz.f32 	%f353, %f338, %f75;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f354, %f351, %f351, %f348;
	fma.rn.ftz.f32 	%f355, %f352, %f352, %f349;
	fma.rn.ftz.f32 	%f356, %f353, %f353, %f350;
	.loc 1 24 1
	sub.ftz.f32 	%f357, %f336, %f83;
	sub.ftz.f32 	%f358, %f337, %f82;
	sub.ftz.f32 	%f359, %f338, %f81;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f360, %f357, %f357, %f354;
	fma.rn.ftz.f32 	%f361, %f358, %f358, %f355;
	fma.rn.ftz.f32 	%f362, %f359, %f359, %f356;
	.loc 1 24 1
	sub.ftz.f32 	%f363, %f336, %f89;
	sub.ftz.f32 	%f364, %f337, %f88;
	sub.ftz.f32 	%f365, %f338, %f87;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f366, %f363, %f363, %f360;
	fma.rn.ftz.f32 	%f367, %f364, %f364, %f361;
	fma.rn.ftz.f32 	%f368, %f365, %f365, %f362;
	.loc 1 24 1
	sub.ftz.f32 	%f369, %f336, %f95;
	sub.ftz.f32 	%f370, %f337, %f94;
	sub.ftz.f32 	%f371, %f338, %f93;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f372, %f369, %f369, %f366;
	fma.rn.ftz.f32 	%f373, %f370, %f370, %f367;
	fma.rn.ftz.f32 	%f374, %f371, %f371, %f368;
	.loc 1 24 1
	sub.ftz.f32 	%f375, %f336, %f101;
	sub.ftz.f32 	%f376, %f337, %f100;
	sub.ftz.f32 	%f377, %f338, %f99;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f378, %f375, %f375, %f372;
	fma.rn.ftz.f32 	%f379, %f376, %f376, %f373;
	fma.rn.ftz.f32 	%f380, %f377, %f377, %f374;
	.loc 1 24 1
	sub.ftz.f32 	%f381, %f336, %f107;
	sub.ftz.f32 	%f382, %f337, %f106;
	sub.ftz.f32 	%f383, %f338, %f105;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f384, %f381, %f381, %f378;
	fma.rn.ftz.f32 	%f385, %f382, %f382, %f379;
	fma.rn.ftz.f32 	%f386, %f383, %f383, %f380;
	.loc 1 24 1
	sub.ftz.f32 	%f387, %f336, %f113;
	sub.ftz.f32 	%f388, %f337, %f112;
	sub.ftz.f32 	%f389, %f338, %f111;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f390, %f387, %f387, %f384;
	fma.rn.ftz.f32 	%f391, %f388, %f388, %f385;
	fma.rn.ftz.f32 	%f392, %f389, %f389, %f386;
	.loc 1 24 1
	mul.ftz.f32 	%f393, %f391, 0f3DE38E39;
	fma.rn.ftz.f32 	%f394, %f390, 0f3DE38E39, %f393;
	fma.rn.ftz.f32 	%f395, %f392, 0f3DE38E39, %f394;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f117, %f118, %f119, %f120}, [texture0_RECT, {%f187, %f188}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f123, %f124, %f125, %f126}, [texture0_RECT, {%f163, %f182}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f396, %f125, %f119;
	add.ftz.f32 	%f397, %f124, %f118;
	add.ftz.f32 	%f398, %f123, %f117;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f129, %f130, %f131, %f132}, [texture0_RECT, {%f169, %f182}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f399, %f131, %f396;
	add.ftz.f32 	%f400, %f130, %f397;
	add.ftz.f32 	%f401, %f129, %f398;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f135, %f136, %f137, %f138}, [texture0_RECT, {%f223, %f206}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f402, %f137, %f399;
	add.ftz.f32 	%f403, %f136, %f400;
	add.ftz.f32 	%f404, %f135, %f401;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f141, %f142, %f143, %f144}, [texture0_RECT, {%f163, %f206}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f405, %f143, %f402;
	add.ftz.f32 	%f406, %f142, %f403;
	add.ftz.f32 	%f407, %f141, %f404;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f147, %f148, %f149, %f150}, [texture0_RECT, {%f169, %f206}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f408, %f149, %f405;
	add.ftz.f32 	%f409, %f148, %f406;
	add.ftz.f32 	%f410, %f147, %f407;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f153, %f154, %f155, %f156}, [texture0_RECT, {%f223, %f224}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f411, %f155, %f408;
	add.ftz.f32 	%f412, %f154, %f409;
	add.ftz.f32 	%f413, %f153, %f410;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f159, %f160, %f161, %f162}, [texture0_RECT, {%f163, %f224}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f414, %f161, %f411;
	add.ftz.f32 	%f415, %f160, %f412;
	add.ftz.f32 	%f416, %f159, %f413;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f165, %f166, %f167, %f168}, [texture0_RECT, {%f169, %f224}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f417, %f167, %f414;
	add.ftz.f32 	%f418, %f166, %f415;
	add.ftz.f32 	%f419, %f165, %f416;
	.loc 1 24 1
	mul.ftz.f32 	%f420, %f417, 0f3DE38E39;
	mul.ftz.f32 	%f421, %f418, 0f3DE38E39;
	mul.ftz.f32 	%f422, %f419, 0f3DE38E39;
	.loc 1 24 1
	sub.ftz.f32 	%f423, %f420, %f119;
	sub.ftz.f32 	%f424, %f421, %f118;
	sub.ftz.f32 	%f425, %f422, %f117;
	.loc 1 24 1
	mul.ftz.f32 	%f426, %f423, %f423;
	mul.ftz.f32 	%f427, %f424, %f424;
	mul.ftz.f32 	%f428, %f425, %f425;
	.loc 1 24 1
	sub.ftz.f32 	%f429, %f420, %f125;
	sub.ftz.f32 	%f430, %f421, %f124;
	sub.ftz.f32 	%f431, %f422, %f123;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f432, %f429, %f429, %f426;
	fma.rn.ftz.f32 	%f433, %f430, %f430, %f427;
	fma.rn.ftz.f32 	%f434, %f431, %f431, %f428;
	.loc 1 24 1
	sub.ftz.f32 	%f435, %f420, %f131;
	sub.ftz.f32 	%f436, %f421, %f130;
	sub.ftz.f32 	%f437, %f422, %f129;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f438, %f435, %f435, %f432;
	fma.rn.ftz.f32 	%f439, %f436, %f436, %f433;
	fma.rn.ftz.f32 	%f440, %f437, %f437, %f434;
	.loc 1 24 1
	sub.ftz.f32 	%f441, %f420, %f137;
	sub.ftz.f32 	%f442, %f421, %f136;
	sub.ftz.f32 	%f443, %f422, %f135;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f444, %f441, %f441, %f438;
	fma.rn.ftz.f32 	%f445, %f442, %f442, %f439;
	fma.rn.ftz.f32 	%f446, %f443, %f443, %f440;
	.loc 1 24 1
	sub.ftz.f32 	%f447, %f420, %f143;
	sub.ftz.f32 	%f448, %f421, %f142;
	sub.ftz.f32 	%f449, %f422, %f141;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f450, %f447, %f447, %f444;
	fma.rn.ftz.f32 	%f451, %f448, %f448, %f445;
	fma.rn.ftz.f32 	%f452, %f449, %f449, %f446;
	.loc 1 24 1
	sub.ftz.f32 	%f453, %f420, %f149;
	sub.ftz.f32 	%f454, %f421, %f148;
	sub.ftz.f32 	%f455, %f422, %f147;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f456, %f453, %f453, %f450;
	fma.rn.ftz.f32 	%f457, %f454, %f454, %f451;
	fma.rn.ftz.f32 	%f458, %f455, %f455, %f452;
	.loc 1 24 1
	sub.ftz.f32 	%f459, %f420, %f155;
	sub.ftz.f32 	%f460, %f421, %f154;
	sub.ftz.f32 	%f461, %f422, %f153;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f462, %f459, %f459, %f456;
	fma.rn.ftz.f32 	%f463, %f460, %f460, %f457;
	fma.rn.ftz.f32 	%f464, %f461, %f461, %f458;
	.loc 1 24 1
	sub.ftz.f32 	%f465, %f420, %f161;
	sub.ftz.f32 	%f466, %f421, %f160;
	sub.ftz.f32 	%f467, %f422, %f159;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f468, %f465, %f465, %f462;
	fma.rn.ftz.f32 	%f469, %f466, %f466, %f463;
	fma.rn.ftz.f32 	%f470, %f467, %f467, %f464;
	.loc 1 24 1
	sub.ftz.f32 	%f471, %f420, %f167;
	sub.ftz.f32 	%f472, %f421, %f166;
	sub.ftz.f32 	%f473, %f422, %f165;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f474, %f471, %f471, %f468;
	fma.rn.ftz.f32 	%f475, %f472, %f472, %f469;
	fma.rn.ftz.f32 	%f476, %f473, %f473, %f470;
	.loc 1 24 1
	mul.ftz.f32 	%f477, %f475, 0f3DE38E39;
	fma.rn.ftz.f32 	%f478, %f474, 0f3DE38E39, %f477;
	fma.rn.ftz.f32 	%f479, %f476, 0f3DE38E39, %f478;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f171, %f172, %f173, %f174}, [texture0_RECT, {%f211, %f182}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f177, %f178, %f179, %f180}, [texture0_RECT, {%f217, %f182}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f480, %f179, %f173;
	add.ftz.f32 	%f481, %f178, %f172;
	add.ftz.f32 	%f482, %f177, %f171;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f183, %f184, %f185, %f186}, [texture0_RECT, {%f187, %f188}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f483, %f185, %f480;
	add.ftz.f32 	%f484, %f184, %f481;
	add.ftz.f32 	%f485, %f183, %f482;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f189, %f190, %f191, %f192}, [texture0_RECT, {%f211, %f206}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f486, %f191, %f483;
	add.ftz.f32 	%f487, %f190, %f484;
	add.ftz.f32 	%f488, %f189, %f485;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f195, %f196, %f197, %f198}, [texture0_RECT, {%f217, %f206}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f489, %f197, %f486;
	add.ftz.f32 	%f490, %f196, %f487;
	add.ftz.f32 	%f491, %f195, %f488;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f201, %f202, %f203, %f204}, [texture0_RECT, {%f223, %f206}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f492, %f203, %f489;
	add.ftz.f32 	%f493, %f202, %f490;
	add.ftz.f32 	%f494, %f201, %f491;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f207, %f208, %f209, %f210}, [texture0_RECT, {%f211, %f224}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f495, %f209, %f492;
	add.ftz.f32 	%f496, %f208, %f493;
	add.ftz.f32 	%f497, %f207, %f494;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f213, %f214, %f215, %f216}, [texture0_RECT, {%f217, %f224}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f498, %f215, %f495;
	add.ftz.f32 	%f499, %f214, %f496;
	add.ftz.f32 	%f500, %f213, %f497;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f219, %f220, %f221, %f222}, [texture0_RECT, {%f223, %f224}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f501, %f221, %f498;
	add.ftz.f32 	%f502, %f220, %f499;
	add.ftz.f32 	%f503, %f219, %f500;
	.loc 1 24 1
	mul.ftz.f32 	%f504, %f501, 0f3DE38E39;
	mul.ftz.f32 	%f505, %f502, 0f3DE38E39;
	mul.ftz.f32 	%f506, %f503, 0f3DE38E39;
	.loc 1 24 1
	sub.ftz.f32 	%f507, %f504, %f173;
	sub.ftz.f32 	%f508, %f505, %f172;
	sub.ftz.f32 	%f509, %f506, %f171;
	.loc 1 24 1
	mul.ftz.f32 	%f510, %f507, %f507;
	mul.ftz.f32 	%f511, %f508, %f508;
	mul.ftz.f32 	%f512, %f509, %f509;
	.loc 1 24 1
	sub.ftz.f32 	%f513, %f504, %f179;
	sub.ftz.f32 	%f514, %f505, %f178;
	sub.ftz.f32 	%f515, %f506, %f177;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f516, %f513, %f513, %f510;
	fma.rn.ftz.f32 	%f517, %f514, %f514, %f511;
	fma.rn.ftz.f32 	%f518, %f515, %f515, %f512;
	.loc 1 24 1
	sub.ftz.f32 	%f519, %f504, %f185;
	sub.ftz.f32 	%f520, %f505, %f184;
	sub.ftz.f32 	%f521, %f506, %f183;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f522, %f519, %f519, %f516;
	fma.rn.ftz.f32 	%f523, %f520, %f520, %f517;
	fma.rn.ftz.f32 	%f524, %f521, %f521, %f518;
	.loc 1 24 1
	sub.ftz.f32 	%f525, %f504, %f191;
	sub.ftz.f32 	%f526, %f505, %f190;
	sub.ftz.f32 	%f527, %f506, %f189;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f528, %f525, %f525, %f522;
	fma.rn.ftz.f32 	%f529, %f526, %f526, %f523;
	fma.rn.ftz.f32 	%f530, %f527, %f527, %f524;
	.loc 1 24 1
	sub.ftz.f32 	%f531, %f504, %f197;
	sub.ftz.f32 	%f532, %f505, %f196;
	sub.ftz.f32 	%f533, %f506, %f195;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f534, %f531, %f531, %f528;
	fma.rn.ftz.f32 	%f535, %f532, %f532, %f529;
	fma.rn.ftz.f32 	%f536, %f533, %f533, %f530;
	.loc 1 24 1
	sub.ftz.f32 	%f537, %f504, %f203;
	sub.ftz.f32 	%f538, %f505, %f202;
	sub.ftz.f32 	%f539, %f506, %f201;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f540, %f537, %f537, %f534;
	fma.rn.ftz.f32 	%f541, %f538, %f538, %f535;
	fma.rn.ftz.f32 	%f542, %f539, %f539, %f536;
	.loc 1 24 1
	sub.ftz.f32 	%f543, %f504, %f209;
	sub.ftz.f32 	%f544, %f505, %f208;
	sub.ftz.f32 	%f545, %f506, %f207;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f546, %f543, %f543, %f540;
	fma.rn.ftz.f32 	%f547, %f544, %f544, %f541;
	fma.rn.ftz.f32 	%f548, %f545, %f545, %f542;
	.loc 1 24 1
	sub.ftz.f32 	%f549, %f504, %f215;
	sub.ftz.f32 	%f550, %f505, %f214;
	sub.ftz.f32 	%f551, %f506, %f213;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f552, %f549, %f549, %f546;
	fma.rn.ftz.f32 	%f553, %f550, %f550, %f547;
	fma.rn.ftz.f32 	%f554, %f551, %f551, %f548;
	.loc 1 24 1
	sub.ftz.f32 	%f555, %f504, %f221;
	sub.ftz.f32 	%f556, %f505, %f220;
	sub.ftz.f32 	%f557, %f506, %f219;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f558, %f555, %f555, %f552;
	fma.rn.ftz.f32 	%f559, %f556, %f556, %f553;
	fma.rn.ftz.f32 	%f560, %f557, %f557, %f554;
	.loc 1 24 1
	mul.ftz.f32 	%f561, %f559, 0f3DE38E39;
	fma.rn.ftz.f32 	%f562, %f558, 0f3DE38E39, %f561;
	fma.rn.ftz.f32 	%f563, %f560, 0f3DE38E39, %f562;
	setp.lt.ftz.f32	%p4, %f311, %f395;
	selp.f32	%f564, 0f3F800000, 0f00000000, %p4;
	.loc 1 24 1
	sub.ftz.f32 	%f565, %f227, %f564;
	mul.ftz.f32 	%f566, %f565, %f336;
	fma.rn.ftz.f32 	%f567, %f564, %f252, %f566;
	mul.ftz.f32 	%f568, %f565, %f337;
	fma.rn.ftz.f32 	%f569, %f564, %f253, %f568;
	mul.ftz.f32 	%f570, %f565, %f338;
	fma.rn.ftz.f32 	%f571, %f564, %f254, %f570;
	mul.ftz.f32 	%f572, %f565, %f395;
	fma.rn.ftz.f32 	%f573, %f564, %f311, %f572;
	.loc 1 24 1
	setp.lt.ftz.f32	%p5, %f563, %f479;
	selp.f32	%f574, 0f3F800000, 0f00000000, %p5;
	.loc 1 24 1
	sub.ftz.f32 	%f575, %f227, %f574;
	mul.ftz.f32 	%f576, %f575, %f420;
	fma.rn.ftz.f32 	%f577, %f574, %f504, %f576;
	mul.ftz.f32 	%f578, %f575, %f421;
	fma.rn.ftz.f32 	%f579, %f574, %f505, %f578;
	mul.ftz.f32 	%f580, %f575, %f422;
	fma.rn.ftz.f32 	%f581, %f574, %f506, %f580;
	mul.ftz.f32 	%f582, %f575, %f479;
	fma.rn.ftz.f32 	%f583, %f574, %f563, %f582;
	.loc 1 24 1
	setp.lt.ftz.f32	%p6, %f583, %f573;
	selp.f32	%f584, 0f3F800000, 0f00000000, %p6;
	.loc 1 24 1
	sub.ftz.f32 	%f585, %f227, %f584;
	mul.ftz.f32 	%f586, %f585, %f567;
	fma.rn.ftz.f32 	%f2, %f584, %f577, %f586;
	mul.ftz.f32 	%f587, %f585, %f569;
	fma.rn.ftz.f32 	%f3, %f584, %f579, %f587;
	mul.ftz.f32 	%f588, %f585, %f571;
	fma.rn.ftz.f32 	%f4, %f584, %f581, %f588;
	.loc 1 24 1
	mad.lo.s32 	%r3, %r2, %r4, %r1;
	.loc 1 24 1
	setp.eq.s32	%p7, %r5, 0;
	@%p7 bra 	BB0_3;

	mul.wide.s32 	%rd75, %r3, 16;
	add.s64 	%rd76, %rd1, %rd75;
	.loc 1 24 1
	st.global.v4.f32 	[%rd76], {%f4, %f3, %f2, %f186};
	bra.uni 	BB0_4;

BB0_3:
	mul.wide.s32 	%rd77, %r3, 8;
	add.s64 	%rd78, %rd1, %rd77;
	.loc 2 3513 10
	{
	.reg .b16 %temp;
	cvt.rn.ftz.f16.f32 	%temp, %f4;
	mov.b16 	%rs1, %temp;
}
	.loc 2 3513 10
	{
	.reg .b16 %temp;
	cvt.rn.ftz.f16.f32 	%temp, %f3;
	mov.b16 	%rs2, %temp;
}
	.loc 2 3513 10
	{
	.reg .b16 %temp;
	cvt.rn.ftz.f16.f32 	%temp, %f2;
	mov.b16 	%rs3, %temp;
}
	.loc 2 3513 10
	{
	.reg .b16 %temp;
	cvt.rn.ftz.f16.f32 	%temp, %f186;
	mov.b16 	%rs4, %temp;
}
	.loc 1 24 241
	st.global.v4.u16 	[%rd78], {%rs1, %rs2, %rs3, %rs4};

BB0_4:
	.loc 1 24 2
	ret;
}


